Artificiell intelligens kan upptäcka blåvals "D-samtal" i ljudinspelningar, med större noggrannhet och snabbhet än mänskliga experter. Kredit:Australian Antarctic Division
Valforskare kan snart klara sig själva – eller åtminstone ett tröttsamt och repetitivt jobb – genom att använda artificiell intelligens (AI) i sin forskning.
Med hjälp av maskininlärning har ett team från Australian Antarctic Division, K. Lisa Yang Center for Conservation Bioacoustics vid Cornell University och Curtin University tränat en algoritm för att upptäcka blåvals "D-call" i ljudinspelningar, med större noggrannhet och hastighet än mänskliga experter.
Valakustikern Dr Brian Miller sa att tekniken kommer att göra det möjligt för forskare att lättare analysera hundratusentals timmars inspelningar av dessa svårfångade och svårstuderade valar, för att bättre förstå trender i deras populationer när de återhämtar sig från valfångst.
"Genom att analysera våra inspelningar för D-samtal och andra ljud får vi en mer komplett bild av beteendet hos dessa djur, och trenderna och potentiella förändringar i deras beteende," sa Dr. Miller.
"Den djupinlärningsalgoritm vi har tillämpat på den här uppgiften överträffar erfarna valakustiker i noggrannhet, den är mycket snabbare och den blir inte trött.
"Så det frigör oss att fundera över andra stora frågor."
Sociala samtal
D-samtal tros vara "sociala" samtal som görs av han- och honvalar på utfodringsplatser. Till skillnad från manliga blåvalar "sånger", som har ett regelbundet och förutsägbart mönster, är D-samtal mycket varierande över enskilda valar och över årstider och år.
Denna variation gör automatisering av inspelningsanalysen svårare än vad det skulle vara för ett konsekvent ljud.
För att övervinna detta tränade teamet algoritmen på ett omfattande bibliotek med cirka 5 000 D-samtal, fångat på 2 000 timmars ljud inspelat från platser runt Antarktis mellan 2005 och 2017.
"Biblioteket täckte olika årstider och det utbud av livsmiljöer som vi förväntar oss att hitta blåvalar i Antarktis, för att säkerställa att vi fångade variabiliteten i D-Calls såväl som de variabla ljudlandskapen genom vilka valarna färdas", sa Dr. Miller.
Innan utbildningen kunde påbörjas gick dock sex olika mänskliga analytiker igenom inspelningarna och identifierade eller "kommenterade" D-samtalen.
Istället för att analysera ljudet förvandlades samtalen till "spektrogram" eller visuella representationer av varje samtal och dess varaktighet.
Med hjälp av maskininlärningstekniker tränade algoritmen sig själv i att identifiera D-samtal från 85 % av data i biblioteket, och använde de återstående 15 % av data för att validera sig själv och förbättra.
Människa vs maskin
Den tränade AI:n fick sedan en testdatauppsättning med 187 timmars kommenterade inspelningar från ett år på Casey 2019.
Forskargruppen jämförde antalet D-call-detektioner som AI gjorde, med de som identifierats av mänskliga experter, för att se var de inte var överens.
En oberoende mänsklig domare (Dr. Miller) bestämde vilka av meningsskiljaktigheterna som var D-samtal eller inte, för att komma med ett slutgiltigt beslut om vem som var mer exakt.
"AI:n hittade cirka 90 % av D-samtal och människan drygt 70 %, och AI:n var bättre på att upptäcka mycket tysta ljud," sa Dr. Miller.
"Det tog ungefär 10 timmars mänsklig ansträngning att kommentera testdatauppsättningen, men det tog AI 30 sekunder att analysera dessa data – 1 200 gånger snabbare."
Teamet har gjort sin AI tillgänglig för andra valforskare runt om i världen, för att träna den på andra valljud och ljudlandskap.
"Nu när vi har denna kraft att analysera tusentals timmar av ljud mycket snabbt, skulle det vara fantastiskt att bygga fler inspelningsplatser och större inspelningsnätverk, och utveckla ett långsiktigt övervakningsprojekt för att titta på trender inom blåval och andra arter, " sa Dr. Miller.
Forskningen publiceras i Remote Sensing in Ecology and Conservation . + Utforska vidare