• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Nya big data-algoritmer förbättrar jordbävningsdetektering; övervaka boskapens hälsa och jordbrukets skadedjur

    Kredit:CC0 Public Domain

    Två nya algoritmer kan hjälpa tidiga varningssystem för jordbävningar att ge dig några extra sekunder att släppa, omslag, och håll ut innan marken börjar skaka.

    Datavetare vid University of California, Riverside har utvecklat två algoritmer som kommer att förbättra jordbävningsövervakningen och hjälpa bönder att skydda sina grödor från farliga insekter, eller övervaka hälsan hos kycklingar och andra djur. Algoritmerna upptäcker snabbt mönster i enorma datamängder, med mindre datorkraft och lägre kostnad, än andra metoder och har använts för att förbättra jordbävningsdetektering, övervaka insektsvektorn asiatisk citrus psyllid, och utvärdera utfodringsbeteendet hos kycklingar.

    Big data, stora problem

    Sensorer, såsom seismiska sensorer, som automatiskt registrerar händelser som inträffar upprepade gånger under en tidsperiod, har ett problem. De samlar in så mycket data att det är svårt att upptäcka mönster. Tidsserieanalys avhjälper detta genom att leta efter andra exempel på en provsekvens i en datauppsättning, använder vanligtvis grafiska bearbetningsenheter, eller GPU:er. Men för mycket stora datamängder blir detta opraktiskt eftersom det kräver för många GPU:er, vilket ökar kostnaden.

    Zachary Zimmerman, doktorand i datavetenskap vid Marlan and Rosemary Bourns College of Engineering, byggd på en algoritm som tidigare utvecklats av medförfattaren och professorn i datavetenskap Eamonn Keogh för att hantera extremt stora datamängder och körde den på 40 GPU:er värd på Amazon Web Services-molnet.

    Algoritmen, kallas SCAMP, sorterade nästan två år av seismiska inspelningar från Kaliforniens Parkfield Fault, ett segment av San Andreas-förkastningen som ligger nära staden Parkfield, på bara 10 timmar, till en rimlig kostnad av cirka 300 USD, och upptäckte 16 gånger fler jordbävningar än vad som tidigare var känt.

    "Det är svårt att överbetona hur skalbar den här algoritmen är, " sa Keogh. "För att visa detta, vi gjorde en kvintiljon – det är 1 följt av 18 nollor – parvisa jämförelser av utdrag av jordbävningsdata. Ingenting annat i litteraturen ligger inom en tiondel av en procent av den storleken."

    Att identifiera jordbävningar är inte alltid lätt

    "Det mest grundläggande problemet inom seismologi är att identifiera jordbävningar överhuvudtaget. Det har skett ett antal metodologiska förbättringar av seismologer som tillämpar strategier från datavetenskap för att leta efter liknande mönster, " sa medförfattaren Gareth Funning, en docent i seismologi. "Det stora framsteg här är att datauppsättningen du kan hantera är sätt, mycket större. När vi tittar på seismiska data trodde vi att vi klarade oss bra när vi jämförde allt inom ett tvåmånaders tidsfönster."

    Andra metoder för jordbävningsdetektering kräver att algoritmen hittar sekvenser som matchar en känd jordbävning. UC Riverside-metoden jämför istället allt inom en given tid och kan därmed identifiera jordbävningar som inte nödvändigtvis matchar en given som modell.

    Till exempel, deras analys av Parkfield-data upptäckt subtila, lågfrekventa jordbävningar under San Andreas-förkastningen. Sekvenser av dessa jordbävningar, även känd som icke-vulkaniska skakningar, följa med djupt, långsamma rörelser av tektoniska plattor.

    Storheter av lågfrekventa jordbävningar har ibland föregått massiva jordbävningar, som den i Japan för 10 år sedan. Bättre detektering av lågfrekventa jordbävningar kan bidra till att förbättra prognoserna för de största jordbävningarna och även hjälpa forskare att bättre övervaka rörelser av tektoniska plattor.

    Från jordbävningar till höns och skadeinsekter

    SCAMP-algoritmen kan också upptäcka skadliga skadedjur i jordbruket. Keogh fäste sensorer som registrerade insekters rörelser när de sög saft ur löv och använde algoritmen för att identifiera asiatisk citrus psyllid, insekten som ansvarar för förödande citrusgrödor genom att sprida bakterierna som orsakar Huanglongbing, eller citrusgrönande sjukdom. Han använde också algoritmen för att analysera en datauppsättning från accelerometrar, som mäter olika typer av rörelser, fäst vid kycklingar under en period av dagar. SCAMP identifierade sedan specifika mönster relaterade till matning och andra beteenden.

    SCAMP har en begränsning, dock.

    "SCAMP kräver att du har hela tidsserien innan du söker. I fall av utvinning av historiska seismologiska data, det har vi. Eller i en vetenskaplig studie, vi kan köra runt kycklingen i 10 timmar och analysera data i efterhand, " sa medförfattaren Philip Brisk, en docent i datavetenskap och Zimmermans doktorandrådgivare. "Men med dataströmning direkt från sensorn, vi vill inte vänta 10 timmar. Vi vill kunna säga att något händer nu."

    Snabbare jordbävningsdetektering i realtid

    Zimmerman använde miljarden datapunkter, kallas en matrisprofil, genererad av SCAMPs analys av Parkfield-feldata för att träna en algoritm som han kallade LAMP. LAMP jämför strömmande data med exempel den har sett tidigare för att välja den mest relevanta informationen när den kommer från sensorn.

    "Att ha matrisprofilen tillgänglig för dig vid sensorn innebär att du omedelbart kan veta vad som är viktigt och vad som inte är det. Du kan göra alla dina kontroller i realtid eftersom du bara tittar igenom de viktiga bitarna, " sa Zimmerman.

    Möjligheten att snabbare tolka seismiska data skulle kunna förbättra jordbävningsvarningssystem som redan finns.

    "Med tidig varning för jordbävningar, du försöker upptäcka saker på övervakningsstationer och sedan vidarebefordra informationen till ett centralt system som utvärderar om det är en stor jordbävning eller inte, ", sa Funning. "En sådan här installation skulle potentiellt kunna göra mycket av det där diskrimineringsarbetet innan det överförs till systemet. Du kan ta ledigt från den beräkning som krävs för att fastställa att en skadlig händelse pågår, köpa folk ett par extra sekunder att släppa, omslag, och håll ut."

    "Ett par sekunder är enormt i tidig varning för jordbävningar, " han lade till.

    Tidningen om SCAMP, "Matrix Profile XIV:Scaling Time Series Motif Discovery med GPU:er för att bryta en Quintillion parvisa jämförelser en dag och längre, " presenterades vid ACM Symposium on Cloud Computing 20–23 november, 2019 i Santa Cruz. Författare är Zachary Zimmerman, Kaveh Kamgar, Nader Shakibay Senobari, Brian Crites, Gareth Funning, Philip Brisk och Eamonn Keogh.

    Tidningen om LAMPA, "Matrix Profile XVIII:Time Series Mining inför snabbrörliga strömmar med hjälp av en inlärd ungefärlig matrisprofil, " presenterades vid 2019 IEEE International Conference on Data Mining som hölls i Peking tidigare i november. Författarna är Zachary Zimmerman, Nader Shakibay Senobari, Gareth Funning, Evangelos Papalexakis, Samet Oymak, Philip Brisk, och Eamonn Keogh.


    © Vetenskap https://sv.scienceaq.com