Kredit:CC0 Public Domain
AI används alltmer för att hjälpa mänskliga operatörer att hantera enorma mängder bilder från CCTV och andra säkerhetskällor. Person re-identification (ReID) är en metod där en AI kan känna igen bilder av samma person tagna från olika kameror eller vid olika tillfällen. Detta hjälper till att spåra misstänkta över ett CCTV-nätverk som täcker stora offentliga utrymmen, till exempel ett underjordiskt nätverk. ReID är utmanande för maskiner eftersom de måste beakta och särskilja samma person under olika ljuskällor, poser och förändringar i utseende som deras kläder.
I ett dokument som ska presenteras vid årets internationella konferens om datorseende i Seoul, Sydkorea, den mest prestigefyllda konferensen inom visuell AI, experter från Surrey's Center for Vision, Tal och signalbehandling (CVSSP) beskriver hur de har utvecklat ett unikt system kallat OSNet som har överträffat många populära identifieringssystem som redan används.
CVSSP-teamet har visat att OSNet kan borra ner i information från en mängd olika rumsliga skalor för att göra en omidentifiering exakt – från de minsta detaljerna som logotypen på en t-shirt till andra, större faktorer som vilken typ av kappa den misstänkte bär.
Otroligt, OSNet behöver bara 2,2 miljoner parametrar, ett mycket litet antal i samband med modeller för djupa neurala nätverk, att överträffa många av sina konkurrenter byggd på den populära ResNet50-infrastrukturen som använder 24 miljoner parametrar – vilket tyder på att OSNet kan bli standarden inom visuell igenkänningsteknik. En så liten parameterstorlek gör att modellen kan distribueras "på kanten, " vilket betyder att de tunga beräkningslyftena kan utföras på själva kameran snarare än i ett fjärrdatacenter, sparar bandbredd för att överföra stora mängder videodata från kameror till dataservrarna.
Tao Xiang, Erkänd professor i datorseende och maskininlärning vid CVSSP, sa:"Med OSNet, vi satte oss för att utveckla ett verktyg som kan övervinna många av de problem med återidentifiering av personer som andra anläggningar möter – men resultaten överträffade vida våra förväntningar. ReID-noggrannheten som uppnåtts av OSNet har klart överträffat den hos mänskliga operatörer.
"OSNet visar inte bara att det är kapabelt att överträffa sina motsvarigheter på många återidentifieringsproblem, men resultaten är sådana att vi tror att den skulle kunna användas som en fristående visuell igenkänningsteknik i sin egen rätt."
Professor Adrian Hilton, chef för CVSSP, sa:"Detta är en avsevärd prestation av prof Xiang och hans team när det gäller att uppnå världsledande återidentifieringsteknik. Deras arbete på OSNet har potentialen att bli banbrytande och kan hjälpa till att forma det visuella igenkänningsfältet i många år framöver. Detta är ett bra exempel på AI och maskinuppfattning till gagn för samhället som tillhandahåller möjliggörande teknik för säkrare offentliga utrymmen."