• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Använda djupinlärning för att lokalisera mänskliga ögon i bilder

    Kredit:Liu et al.

    Ett team av forskare vid China University of Geosciences och Wuhan WXYZ Technologies i Kina har nyligen föreslagit en ny maskininlärningsbaserad teknik för att lokalisera människors ögon i bilder av deras ansikten. Denna teknik, presenteras i en artikel publicerad i Elseviers tidskrift Neurocomputering , kan ha flera användbara tillämpningar. Till exempel, den kan användas för att upptäcka dåsighet hos personer som kör bil eller utför uppgifter som kräver en viss grad av vakenhet och uppmärksamhet.

    Dåsighet kan i hög grad försämra människors beslutsförmåga, samt deras uppmärksamhet och minne. Dåsighet när du kör bil eller utför en viktig uppgift kan leda till en betydande nedgång i effektivitet, och i vissa fall, till och med orsaka livshotande olyckor.

    Ett av de mest effektiva sätten att uppskatta nivåer av dåsighet hos människor är att titta på deras ögon, som hos dåsiga människor vanligtvis är mer slutna eller trötta. Automatiskt analysera människors ögon med hjälp av beräkningsmetoder, dock, först och främst innebär det att lokalisera dem i realtidsbilder eller videor.

    "Vårt senaste arbete är en del av vår forskning om uppskattning av dåsighet, " berättade forskarna som utförde studien för TechXplore via e-post. "I våra tidigare arbeten, vi föreslog en initiativservicemodell för servicerobot som skiljer sig från passiv service (dvs. roboten måste vänta på en användares instruktioner när den tillhandahåller service). Vad mer, vi valde en dryckesrobot som ett exempel för att verifiera effektiviteten av initiativservicemodellen."

    Initialt, forskarna ville utveckla en teknik för uppskattning av dåsighet som skulle kunna förbättra det praktiska i en robotplattform som serverar drycker till människor. Det första steget i denna riktning var att skapa en automatisk metod för att lokalisera människors ögon i realtid genom att analysera bilder av deras ansikten.

    Övergripande struktur för WBCCNN för ögonlokalisering. Kredit:Liu et al.

    Ögonlokaliseringsmetoden som föreslås av forskarna är baserad på en maskininlärningsteknik känd som viktbinariseringskaskadkonvolutionellt neuralt nätverk (WBCCNN). WBCCNN de utvecklade förutsäger positionen för människors ögon från grova till fina, vilket förbättrar modellens prestanda. Dessutom, den binära komponenten i nätverket hjälper till att minska modellens lagringsstorlek och påskynda dess verksamhet.

    Forskarna utvärderade sin WBCCNN-modell för ögonlokalisering i en serie experiment med bilder från Labeled Faces in the Wild (LFW), BioID och Labeled Face Parts in the Wild (LFPW) dataset. Deras metod uppnådde anmärkningsvärda resultat och överträffade andra tekniker för ögonlokalisering, uppnå ett genomsnittligt detekteringsfel på 0,66 procent vid lokalisering av vänster ögon och 0,71 procent höger ögon.

    Enligt forskarna, den mest meningsfulla prestationen av deras studie var utvecklingen av en WBCCNN där vikten begränsas av binarisering. Denna unika designkaraktär möjliggör besparingar i modellens lagringskapacitet, samtidigt som de minskar dess beräkningskostnader. I framtiden, den nya WBCCNN-modellen kan hjälpa till att utveckla effektiva verktyg för att uppskatta människors dåsighet, samt andra känslor eller tillstånd som kan upptäckas genom att analysera människors ögon.

    "Tillförlitlig ögonlokalisering är nödvändig för att uppskatta dåsighet, Således, vi kommer nu att försöka tillämpa den föreslagna ögonlokaliseringsmetoden på initiativservice av robotar för uppskattning av dåsighet, utformad för att hjälpa till att öka människors arbetseffektivitet, " sa forskarna.

    © 2019 Science X Network




    © Vetenskap https://sv.scienceaq.com