Ett diagram över det föreslagna åldersuppskattningssystemet. Upphovsman:Agbo-Ajala &Viriri.
Under de senaste åren, forskare har skapat ett växande antal maskininlärning (ML) -baserade tekniker för ansiktsigenkänning, som kan ha många intressanta applikationer, till exempel, förbättra övervakningsövervakningen, säkerhetskontroll, och eventuellt även rättsmedicinsk konst. Förutom ansiktsigenkänning, framsteg inom ML har också möjliggjort utveckling av verktyg för att förutsäga eller uppskatta specifika egenskaper (t.ex. kön eller ålder) på en person genom att analysera bilder av deras ansikten.
I en färsk studie, forskare vid University of Kwazulu-Natal, i Sydafrika, utvecklat en maskininlärningsbaserad modell för att uppskatta människors ålder genom att analysera bilder av deras ansikten tagna i slumpmässiga verkliga miljöer. Den nya arkitekturen introducerades i ett dokument publicerat av Spinger och presenterades för några dagar sedan på International Conference on Computational Collective Intelligence (ICCCI) 2019.
De flesta traditionella metoder för åldersklassificering fungerar bara bra när man analyserar ansiktsbilder tagna i kontrollerade miljöer, till exempel, i labbet eller i fotostudior. Å andra sidan, mycket få av dessa kan uppskatta åldern på människor i bilder tagna i verkliga vardagliga miljöer.
"Deep learning -metoder har visat sig vara effektiva för att lösa detta problem, särskilt med tillgången på både en stor mängd data för utbildning och avancerade maskiner, "forskarna skrev i sin uppsats." Med tanke på detta, vi föreslår en djupinlärningslösning för att uppskatta ålder från verkliga ansikten. "
Forskargruppen vid University of Kwazulu-Natal utvecklade en djup konvolutionell neuralnätverk (CNN) -baserad arkitektur med sex lager. Deras modell utbildades för att uppskatta individers ålder från bilder av ansikten tagna i okontrollerade miljöer. Arkitekturen uppnår detta genom att lära sig vilka ansiktsrepresentationer som är mest avgörande för åldersuppskattning och fokusera på just dessa egenskaper.
Bildförbehandlingsfasen. Upphovsman:Agbo-Ajala &Viriri.
För att förbättra prestandan för deras CNN-baserade modell, forskarna förtränade den på en stor datamängd som heter IMDB-WIKI, som innehåller över en halv miljon bilder av ansikten tagna från IMDB och Wikipedia, märkt med varje ämnes ålder. Denna första utbildning gjorde det möjligt för dem att anpassa sin arkitektur till ansiktsbildinnehåll.
Senare, forskarna ställde in modellen med bilder från ytterligare två databaser, nämligen MORPH-II och OUI-Adience, träna den för att fånga särdrag och skillnader. MORPH-II innehåller cirka 70, 000 märkta bilder av ansikten, medan OUI-Adience innehåller 26, 580 ansiktsbilder tagna i idealiska verkliga miljöer.
När de utvärderade sin modell på bilder tagna i okontrollerade miljöer, forskarna fann att denna omfattande utbildning ledde till anmärkningsvärda prestanda. Deras modell uppnådde toppmoderna resultat, överträffar flera andra CNN-baserade metoder för åldersuppskattning.
"Våra experiment visar effektiviteten av vår metod för åldersuppskattning i naturen när den utvärderas på OUI-Adience-riktmärket, som är känt för att innehålla bilder av ansikten förvärvade under idealiska och obegränsade förhållanden, "skrev forskarna." Den föreslagna åldersklassificeringsmetoden uppnår nya toppmoderna resultat, med en förbättring av noggrannheten på 8,6 procent (exakt) och 3,4 procent (engång) jämfört med det bäst rapporterade resultatet på OUI-Adience-datauppsättningen. "
I framtiden, den nya CNN-baserade arkitekturen som utvecklats av dessa forskare kan möjliggöra effektivare åldersuppskattningsimplementeringar i en mängd olika verkliga miljöer. Teamet planerar också att lägga till lager till modellen och träna den på andra datamängder av ansiktsbilder som tagits i okontrollerade miljöer så snart de blir tillgängliga, för att ytterligare förbättra dess prestanda.
© 2019 Science X Network