Fåglar spelar en viktig roll i en mängd olika ekosystem som både rovdjur och bytesdjur, för att kontrollera insektspopulationer, pollinering och fröspridning för många växter, och att släppa ut näringsämnen till land och hav i form av guano. Ur ett vetenskapligt perspektiv är det därför avgörande att övervaka fågelpopulationer. Nu, forskning publicerad i International Journal of Computer Applications in Technology kan bana väg för ett automatiskt fågelidentifieringssystem baserat på fågelrop och sång.
Arti Bang och Priti Rege från College of Engineering, i Pune, Indien, förklara att fågelsånger och fågelsång består av stavelser och varje rop och sång som är unik för en given art består av en grupp stavelser som i sin tur är uppbyggda av element. Det är möjligt att utföra en spektrografisk analys av ljudet, men detta är mödosamt och kräver experter med ett bra gehör för fåglarnas ljud. I sista hand, dock, ett sådant tillvägagångssätt kommer att vara subjektivt när det gäller att skilja mellan fåglar med mycket liknande klingande rop och sånger.
Teamet föreslår att automatiserad fågeligenkänning baserat på inspelningar av ljuden som fåglarna gör är ett problem med mönsterigenkänning. Som sådan, de har utvecklat ett automatiserat system som kringgår problemen i samband med tidigare försök att automatisera processen och bygger på att extrahera stavelser med 10 millisekunders ljudramar. Analysen bygger sedan på tekniker som har använts för att extrahera information, som tempo, förtecken, och genre från inspelningar av musik.
Teamet testade algoritmen som utvecklats från studien på prover av fågelsånger och samtal från den omfattande och välkända internationella databasen Xeno Canto. De gjorde preliminära tester av systemet med klassificering av tio fågelarter hemmahörande i Indien, utförd med Gaussian Mixture Modeling (GMM) och Support Vector Machines (SVM). Samma tillvägagångssätt kan också tillämpas på arter som finns var som helst i världen. Redundansreduktion i systemet gör att de kan minska effekterna av bakgrundsljud i en given ljudinspelning och på så sätt förbättra noggrannheten ytterligare.