• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Tre konvolutionella neurala nätverksmodeller för ansiktsuttrycksigenkänning i naturen

    Den grundläggande strukturen för Light-CNN. Upphovsman:Jie &Yongsheng.

    Två forskare vid Shanghai University of Electric Power har nyligen utvecklat och utvärderat nya neurala nätverksmodeller för ansiktsuttrycksigenkänning (FER) i naturen. Deras studie, publicerad i Elseviers tidskrift Neurocomputing, presenterar tre modeller av konvolutionella neurala nätverk (CNN):ett Light-CNN, en dubbelgrenad CNN och en förutbildad CNN.

    "På grund av bristen på information om icke-frontala ansikten, FER i naturen är en svår punkt i datorsyn, "Qian Yongsheng, en av forskarna som genomförde studien, berättade TechXplore. "Befintliga metoder för igenkänning av ansiktsuttryck baserade på djupa konvolutionella neurala nätverk (CNN) ger flera problem, inklusive övermontering, hög beräkningskomplexitet, enda funktion och begränsade prover. "

    Även om många forskare har utvecklat CNN -metoder för FER, än så länge, väldigt få av dem har försökt bestämma vilken typ av nätverk som är bäst lämpad för just den här uppgiften. Medveten om denna lucka i litteraturen, Yongsheng och hans kollega Shao Jie utvecklade tre olika CNN för FER och genomförde en rad utvärderingar för att identifiera deras styrkor och svagheter.

    "Vår första modell är ett grunt ljus-CNN som introducerar en på djupet separerbar modul med den återstående nätverksmodulen, reducera nätverksparametrar genom att ändra konvolutionsmetoden, "Sa Yongsheng." Den andra är en CNN med två grenar, som kombinerar globala funktioner och lokala texturfunktioner, försöker få rikare funktioner och kompensera för avsaknaden av rotationsvariation av konvolvering. Den tredje förutbildade CNN använder vikter som är utbildade i samma distribuerade stora databas för att träna om sin egen lilla databas, minska träningstiden och förbättra igenkänningsgraden. "

    Ramverk för dubbelgrenade CNN. Upphovsman:Jie &Yongsheng.

    Forskarna genomförde omfattande utvärderingar av sina CNN -modeller på tre datamängder som vanligtvis används för FER:den offentliga CK+, multi-view BU-3DEF och FER2013 datamängder. Även om de tre CNN -modellerna presenterade skillnader i prestanda, de uppnådde alla lovande resultat, överträffar flera toppmoderna metoder för FER.

    "För närvarande, de tre CNN -modellerna används separat, "Förklarade Yongsheng." Det grunda nätverket är mer lämpligt för inbäddad hårdvara. Det förutbildade CNN kan uppnå bättre resultat, men kräver förutbildade vikter. Nätet med två grenar är inte särskilt effektivt. Självklart, man kan också försöka använda de tre modellerna tillsammans. "

    I sina utvärderingar, forskarna observerade att genom att kombinera den återstående nätverksmodulen och den på djupet separerbara modulen, som de gjorde för sin första CNN -modell, nätverksparametrar kan reduceras. Detta kan i slutändan lösa några av bristerna i datormaskinvara. Dessutom, de fann att den förutbildade CNN-modellen överförde en stor databas till sin egen databas och kunde därför utbildas med begränsade prover.

    Ramen för det förutbildade CNN. Upphovsman:Jie &Yongsheng.

    De tre CNN för FER som föreslås av Yongsheng och Jie kan ha många applikationer, till exempel, hjälpa utvecklingen av robotar som kan identifiera ansiktsuttryck för människor som de interagerar med. Forskarna planerar nu att göra ytterligare justeringar av sina modeller, för att ytterligare förbättra deras prestanda.

    "I vårt framtida arbete, vi kommer att försöka lägga till olika traditionella manuella funktioner för att gå med i tvågrenade CNN och ändra fusionsläget, "Yongsheng sa." Vi kommer också att använda parametrar för att utbilda nätverksöverskridande databaser för att få bättre generaliseringsmöjligheter och anta ett mer effektivt djupöverföringsinlärningssätt. "

    © 2019 Science X Network




    © Vetenskap https://sv.scienceaq.com