Forskare spelade in skottliknande ljud på platser där det fanns en sannolikhet för att vapen skulle avfyras, vilket inkluderade en utomhuspark. Kredit:Florida Atlantic University
Enligt Gun Violence Archive har det förekommit 296 masskjutningar i USA i år. Tyvärr är 2021 på väg att bli USA:s dödligaste år av vapenvåld under de senaste två decennierna.
Att skilja mellan en farlig ljudhändelse som en pistolavlossning och en icke-livshotande händelse, till exempel en plastpåse som spricker, kan betyda skillnaden mellan liv och död. Dessutom kan den också avgöra om arbetare ska placeras ut eller inte. Människor, såväl som datorer, blandar ofta ihop ljudet av en plastpåse som poppar och riktiga skottljud.
Under de senaste åren har det funnits en viss tveksamhet inför implementeringen av några av de välkända tillgängliga akustiska skottdetektorsystemen eftersom de kan vara dyra och ofta opålitliga.
I en experimentell studie fokuserade forskare från Florida Atlantic Universitys College of Engineering and Computer Study på att ta itu med tillförlitligheten hos dessa detektionssystem när det gäller den falska positiva frekvensen. En modells förmåga att korrekt urskilja ljud, även i de mest subtila scenarier, kommer att skilja en vältränad modell från en som inte är särskilt effektiv.
Med den skrämmande uppgiften att redogöra för alla ljud som liknar ett skottljud, skapade forskarna en ny datauppsättning bestående av ljudinspelningar av plastpåsexplosioner samlade över en mängd olika miljöer och förhållanden, såsom plastpåsens storlek och avståndet från inspelningen mikrofoner. Inspelningarna från ljudklippen sträckte sig från 400 till 600 millisekunder.
Forskare utvecklade också en klassificeringsalgoritm baserad på ett konvolutionellt neuralt nätverk (CNN), som baslinje, för att illustrera relevansen av denna datainsamlingssatsning. Datan användes sedan, tillsammans med en skottljudsdataset, för att träna en klassificeringsmodell baserad på en CNN för att skilja livshotande skotthändelser från icke-livshotande plastpåsexplosionshändelser.
Forskare använde en ekofri kammare som en av miljöerna, som ger "rena", ostörda prover som i sin tur tillförde mycket information till CNN, vilket gjorde modellen mer robust. Kredit:Florida Atlantic University
Resultaten av studien, publicerade i tidskriften Sensors, visar hur falska skottljud lätt kan förvirra ett skottljudsdetekteringssystem. Sjuttiofem procent av plastpåsens popljud klassificerades fel som skottljud. Den djupinlärningsbaserade klassificeringsmodellen tränad med ett populärt urbant ljuddataset innehållande skottljud kunde inte skilja plastpåspopljud från skottljud. Men när plastpåsens popljud injicerades i modellträning upptäckte forskare att CNN-klassificeringsmodellen fungerade bra när det gällde att skilja faktiska skottljud från ljud från plastpåsar.
"Som människor använder vi ytterligare sensoriska input och tidigare erfarenheter för att identifiera ljud. Datorer är å andra sidan tränade för att dechiffrera information som ofta är irrelevant eller omärklig för mänskliga öron", säger Hanqi Zhuang, Ph.D., senior författare , professor och ordförande, Institutionen för elektroteknik och datavetenskap, Ingenjörshögskolan och datavetenskap. "I likhet med hur fladdermöss sveper runt objekt när de sänder höga ljudvågor som kommer att studsa tillbaka till dem vid olika tidsintervall, använde vi olika miljöer för att ge maskininlärningsalgoritmen en bättre uppfattningskänsla av differentieringen av de närbesläktade ljuden. "
För studien spelades skottliknande ljud in på platser där det fanns en sannolikhet för att vapen skulle avfyras, vilket omfattade totalt åtta inomhus- och utomhusplatser. Datainsamlingsprocessen började med att experimentera med olika typer av påsar, med papperskorgar som valdes ut som de mest lämpliga. De flesta ljudklippen spelades in med sex inspelningsenheter. För att kontrollera i vilken utsträckning en ljudklassificeringsmodell kan förväxlas av falska skott, tränade forskare modellen utan att utsätta den för popljud i plastpåsar.
Det fanns 374 skottprover som ursprungligen användes för att träna modellen, som hämtades från stadsljuddatabasen. Forskare använde 10 klasser från databasen (pistolskott, hundskall, barn som leker, bilhorn, luftkonditionering, gatumusik, siren, tomgångsmotor, hammare och borrning). Efter träningen användes modellen för att testa dess förmåga att avvisa plastpåspopljud som äkta skottljud.
"Den höga andelen felklassificering indikerar att det är mycket svårt för en klassificeringsmodell att urskilja skottliknande ljud som de från popljud från plastpåsar, och riktiga skottljud", säger Rajesh Baliram Singh, första författare och doktor. student vid FAU:s institution för elektroteknik och datavetenskap. "Detta motiverar processen att utveckla en datauppsättning som innehåller ljud som liknar riktiga skottljud."
När det gäller skottdetektering kan en databas med ett visst ljud som kan förväxlas med skottljud men ändå är rikt på mångfald leda till ett mer effektivt skottdetekteringssystem. Detta koncept motiverade forskarna att skapa en databas med explosionsljud i plastpåsar. Ju högre mångfald av samma ljud, desto större är sannolikheten att maskininlärningsalgoritmen kommer att detektera det specifika ljudet korrekt.
"Att förbättra prestandan hos en skottdetekteringsalgoritm, i synnerhet för att minska dess falska positiva frekvens, kommer att minska chanserna att behandla oskadliga ljudutlösare som farliga ljudhändelser som involverar skjutvapen", säger Stella Batalama, Ph.D., dekanus, College i teknik och datavetenskap. "Denna datauppsättning som utvecklats av våra forskare, tillsammans med klassificeringsmodellen de tränade för skott- och skottliknande ljud är ett viktigt steg som leder till mycket färre falska positiva resultat och förbättrar den allmänna säkerheten för allmänheten genom att bara använda kritisk personal när det är nödvändigt."