AI kommer att tjäna till att utveckla ett nätverkskontrollsystem som inte bara upptäcker och reagerar på problem utan också kan förutsäga och undvika dem. Kredit:CC0 Public Domain
Andrey Savchenko, Professor vid Högre Handelshögskolan (HSE University), har utvecklat en metod som kan bidra till att förbättra bildidentifieringen på videor. I sitt projekt, ett nätverk lärdes ut av en ny algoritm och kan nu fatta beslut om bildigenkänning och klassificering i en takt 10 gånger snabbare än tidigare. Denna forskning presenterades i artikeln "Sekventiella trevägsbeslut i bildigenkänning med flera kategorier med djupa funktioner baserade på avståndsfaktor" publicerad i Informationsvetenskap .
Neurala nätverk lärde sig att identifiera människor och djur i videor för länge sedan. Artificiella neuroner kan lära sig genom att komma ihåg hur ett visst föremål ser ut i en bild. Vanligtvis, forskare tar en öppen databas med foton (t.ex. ImageNet, Platser, etc.) och använd den för att lära ut ett neuralt nätverk. För att påskynda beslutsprocessen, vår algoritm är inställd på att bara välja några av exempelbilderna, eller fokusera på ett begränsat antal egenskaper. Komplikationer kan uppstå när föremål av olika klasser är på samma foto, och det finns bara ett litet antal träningsexempel för varje kategori.
Den nya algoritmen kan nu känna igen bilder utan betydande noggrannhetsförsämring genom tillämpning av en sekventiell trevägs-beslutsmetod. Genom att använda detta tillvägagångssätt, ett neuralt nätverk kan analysera enkla bilder på ett sätt för tydligt igenkännbara objekt, medan föremål som är svåra att identifiera kan få en mer ingående undersökning.
"Varje foto kan beskrivas med bokstavligen tusentals funktioner. Så, det skulle inte vara mycket meningsfullt att jämföra alla funktioner i en given ingångsbild med dem i ett grundläggande träningsexempel, eftersom de flesta prover inte skulle likna den analyserade bilden. Så, vi jämförde först bara några av de viktiga funktionerna, och lägga undan träningstillfällena, som uppenbarligen inte kan behandlas som slutgiltiga lösningar. Som ett resultat, träningsurvalet blir mindre och endast ett fåtal exempel finns kvar. I nästa steg, vi skulle öka antalet funktioner för de återstående bilderna, och upprepa sedan denna process tills bara en klass är kvar, " Prof. Savchenko noterade.
Detta tillvägagångssätt minskade tiden för erkännande med 1,5 till 10 gånger, jämfört med vanliga klassificerare och kända sekventiella trevägsbeslut i flera kategorier. Som ett resultat, denna teknik kan användas i framtiden på mobila enheter och andra grundläggande prylar.