Strukturen för den 3D CNN-baserade metoden som beskrivs i tidningen. Kredit:Li et al.
Forskare vid China University of Petroleum (CUP), i Peking, har nyligen utvecklat en ny metod för att upptäcka våld i flera spelare baserad på djupa 3D-konvolutionella neurala nätverk (CNN). Deras metod presenterades i en artikel publicerad i ICNCC 2018:Proceedings of the 2018 VII International Conference on Network, Kommunikation och datoranvändning.
På senare år har framsteg inom datorseende och artificiell intelligens (AI) har lett till utvecklingen av allt mer sofistikerade videoövervakningssystem, som kan hjälpa lokala myndigheter att förebygga brott och övervaka offentliga utrymmen mer effektivt. Trots denna utveckling, de flesta aktuella realtidsövervakningssystem är beroende av mänskliga agenters manuella arbete, vilket kan vara tidskrävande, och ibland leder till att all olaglig verksamhet inte upptäcks.
Forskare har därför försökt utveckla intelligenta och högprecisionsövervakningssystem som skulle göra det möjligt för myndigheter att identifiera ovanligt beteende snabbare och mer effektivt. Att lägga till smarta videoanalysmoduler till ett övervakningssystem skulle i slutändan göra det möjligt för det att autonomt analysera information och upptäcka onormala situationer.
En av nyckelprioriteringarna inom området säkerhet och övervakning är att identifiera våldsamt beteende i offentliga utrymmen för att snabbt kunna ingripa och säkerställa säkerheten för andra medlemmar i samhället. Med detta i åtanke, teamet av forskare vid CUP satte sig för att utveckla en maskininlärningsmetod som snabbt kan upptäcka våldsamt beteende, helt enkelt genom att analysera videoövervakningsfilmer. Metoden som föreslås av forskarna använder en 3-D CNN, som är tränad att analysera videor och upptäcka våldsamma handlingar utförda av flera personer.
"Våldsupptäckt i trånga scener (som köpcentra, banker och arenor) är mycket viktigt, men lite forskning har gjorts [på detta område], " skrev forskarna i sin uppsats. "Baserat på denna situation, Detta dokument föreslår en metod för att upptäcka våld för flera spelare baserad på ett djupt tredimensionellt konvolutionellt neuralt nätverk (3-D CNN) som extraherar spatiotemporal särdragsinformation från flerspelarvåld."
För närvarande, det finns två typer av metoder för att upptäcka våld i videor. Den första typen innebär användning av traditionell funktionsextraktion och en klassificerare, medan den andra använder djupinlärningstekniker. Den nya metoden som forskarna tagit fram faller i den senare kategorin, eftersom tidigare studier tyder på att djupinlärningsmodeller för att upptäcka våld är bekvämare och effektivare än traditionella metoder.
Att träna och utvärdera sin metod, forskarna använde 500 våldsvideor med flera spelare och 500 ickevåldsvideor för flera spelare, med upplösningar upp till 1920*1080. Deras CNN-modell för våldsdetektering är inspirerad av ett nätverk utvecklat av Facebook AI Lab, under 2014.
För att utvärdera deras metod, forskarna genomförde en serie experiment på Nvidia Tesla K80. Deras metod visade sig vara mycket exakt, överträffar tre traditionella metoder för att upptäcka våld som fungerar genom att på konstgjord väg extrahera funktioner. I framtiden, deras 3-D CNN skulle kunna utvecklas ytterligare, så att användarna också kan bestämma platsen för de våldsamma konflikterna som sker i videor.
© 2019 Science X Network