• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Ett maskstyrt uppmärksamhetsnätverk i flera skala med kroppsdelar för återidentifiering av personer

    Bild 1:Vi kan ägna mer uppmärksamhet åt människokroppen, överkropp och underkropp. Kredit:Cai, Wang och Cheng.

    Personåteridentifiering innebär automatisk identifiering av samma person i flera bilder från olika kameror och med olika bakgrunder, vinklar eller positioner. Trots de senaste framstegen inom området artificiell intelligens (AI), Återidentifiering av personer är fortfarande en mycket utmanande uppgift, särskilt på grund av de många variationerna i en persons pose, såväl som andra skillnader i samband med belysning, ocklusion, felinställning och bakgrundsstök.

    Forskare vid Suning R&D Center i USA har nyligen utvecklat en ny teknik för återidentifiering av personer baserad på ett multi-skala kroppsdelad mask guidad uppmärksamhet nätverk (MMGA). Deras papper, förpublicerad på arXiv, kommer att presenteras under 2019 års CVPR Workshop spotlight presentation i juni.

    "Omidentifiering av personer blir en allt viktigare uppgift på grund av dess breda utbud av potentiella tillämpningar, som brottsutredning, allmän säkerhet och bildhämtning, "Honglong Cai, en av forskarna som genomförde studien, berättade TechXplore . "Dock, det är fortfarande en utmanande uppgift, på grund av ocklusion, snedställning, variation av poser och bakgrundsstök. I vår senaste studie, vårt team försökte utveckla en metod för att övervinna dessa utmaningar."

    Istället för att fokusera på hela bilder, Cai och hans kollegor utvecklade en modell för återidentifiering av personer som bara uppmärksammar personen av intresse, ignorerar bakgrunden. Att ta denna idé ett steg längre, deras modell analyserar olika kroppsdelar av personen i en given bild.

    "För att genomföra vår idé, vi föreslog kreativt ett nätverk för maskvägledning i flera skala med kroppsdelar, " Sai Cai. "Vi använder kroppsmasker för att vägleda träningen av vår modell så att den kan ägna mer uppmärksamhet åt människokroppen i bilden. Vår modell innehåller två delar:en funktionsextraktor och en uppmärksamhetsmodul."

    De fem bästa hämtningsresultaten för frågebilder är alla korrekta. Kredit:Cai, Wang och Cheng.

    Funktionsextraktionskomponenten i modellen som utarbetats av Cai och hans kollegor kan extrahera diskriminerande egenskaper hos människors kroppar från bilder. Modellens uppmärksamhetsmodul, å andra sidan, guidar MMGA-nätverket, markera områden av bilden (dvs. pixlar) som den bör vara mer uppmärksam på.

    Forskarna använde kroppsmasker för att vägleda träningen av sin modells uppmärksamhetsmodul, eftersom detta gör det möjligt för den att urskilja mänskliga kroppar från bakgrundsinformation. Dessutom, de delar upp kroppsmasker i överkropps- och underkroppsmasker, så att uppmärksamhetsmodulen kan lära sig att skilja mellan övre och nedre delar av en persons kropp.

    "Till skillnad från de flesta nuvarande metoder för återidentifiering av personer, som delar upp bilder i fasta bilder, vår modell kan berätta exakt var överkroppen och underkroppen är, " förklarade Cai. "Dessutom, kroppsmasker används endast i träningsfasen, och vi kräver inte kroppsmasker i slutledningsfasen, vilket gör vår modell mycket effektiv i praktiska tillämpningar."

    För att utvärdera deras modell, Cai och hans kollegor genomförde en serie experiment som testade dess prestanda på två datamängder, nämligen datauppsättningarna Market-1501 och DukeMTMC-reID. De fann att deras modell kan minska de negativa effekterna av variationer i en persons pose, felinställning och bakgrundsstök, överträffar de senaste metoderna för återidentifiering.

    Resultaten som samlats in av forskarna tyder på att uppmärksamhetsmekanismer avsevärt kan förbättra noggrannheten i nätverk för återidentifiering av personer. Dessutom, deras studie introducerade en maskguide uppmärksamhetsträningsmetod som ytterligare kan förbättra denna noggrannhet.

    "I vårt senaste arbete, överkroppsmasker och underkroppsmasker används för att styra träningen av uppmärksamhetsmodulen, " sa Cai. "I framtiden, vi skulle vilja prova att dela in kroppsmasker i finare detaljer som huvud, hand, ärm, ben, etc., eftersom detta ytterligare skulle kunna förbättra noggrannheten vid återidentifiering av personer."

    © 2019 Science X Network




    © Vetenskap https://sv.scienceaq.com