• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • In-sensor beräkning för att påskynda maskinseende

    a, Illustration av ANN fotodiod array. Alla subpixlar med samma färg är parallellkopplade för att generera M utströmmar. b, Kretsschema för en enda pixel i fotodiodgruppen. c, d, Schema för klassificeraren (c) och autokodaren (d). Nedanför illustrationen av autokodaren, som visas är ett exempel på kodning/avkodning av en bokstav på 28 × 28 pixlar från MNISTs handskrivna sifferdatabas. Den ursprungliga bilden kodas till 9 kodskiktsneuroner och avkodas sedan tillbaka till en bild. Kreditera: Natur (2020). DOI:10.1038/s41586-020-2038-x

    Genom att tillämpa in-sensor beräkning av analoga data, ett team av forskare vid Wiens tekniska universitets Institute of Photonics har utvecklat ett sätt att påskynda maskinseende. I deras papper publicerad i tidskriften Natur , gruppen beskriver sin design och hur väl den presterade under testningen. Yang Chai med Hong Kong Polytechnic University har publicerat en News &Views-artikel i samma tidskriftsnummer som beskriver lagets arbete.

    Med nuvarande teknik, maskinseende utförs med hjälp av ett grundläggande system som involverar en enhet med en bildsensor som reagerar på ljus. Data från bildsensorn konverteras från en analog till en digital signal med en annan enhet. Den digitala informationen bearbetas sedan av ytterligare en enhet, antingen lokalt eller i molnet. Detta system fungerar ganska bra för nuvarande applikationer, men kommer inte att vara lämplig för dem i framtiden på grund av eftersläpningen som är involverad i att läsa och bearbeta enorma mängder bilddata. I denna nya ansträngning, forskarna har föreslagit en ny typ av bildsensor som kan behandla analoga data i begränsad omfattning.

    Bildsensorn som teamet i Österrike tänker sig består av att bädda in trios fotodioder på ett chip på ett sätt som gör det möjligt att öka eller minska deras känslighet för ljus med en applicerad spänning, en uppsättning som gör att varje diod kan ställas in individuellt eller viktas. I en sådan uppställning, dioderna fungerar på samma sätt som nerver i det mänskliga ögat. När bilder presenteras för enheten, alla dioderna reagerar baserat på deras inställning - tillsammans, de fungerar som en nätverksvisionsprocessor. När ljus kommer till sensorn, den bearbetas genom att lägga till ljusintensiteten från var och en av kolumnerna och raderna som utgör sensorgruppen. Arrayen av dioder tränas sedan för en uppgift genom att justera varje medlem individuellt baserat på ett önskat resultat. Det inledande inlärningsstadiet tar lite tid, men när nätverket har tränats, bearbetning sker med en hastighet som är lika med fotodiodernas reaktionstid.

    Enheten som forskarna tänkte sig var inte avsedd att producera bilder. Istället, den filtrerar bort onödig data och utför en inledande sortering. För att testa det, forskarna lärde sin enhet att sortera tre förenklade bokstäver. De använde det också för att göra en del mycket grundläggande automatisk kodning baserat på nyckelfunktioner i en given bild. De noterar att deras design och enhet fortfarande är i proof-of-concept-stadiet, men säger att deras resultat hittills är uppmuntrande.

    © 2020 Science X Network




    © Vetenskap https://sv.scienceaq.com