Martin Schrimpf. Upphovsman:Kris Brewer
När vi öppnar ögonen på morgonen och tar in den första scenen på dagen, Vi tänker inte så mycket på att vår hjärna bearbetar objekten inom vårt synfält med stor effektivitet och att den kompenserar för brist på information om vår omgivning - allt för att vi ska kunna göra vårt dagliga funktioner. Glasvattnet du lämnade på nattduksbordet när du förberedde dig för sängen är nu delvis blockerat från din siktlinje av din väckarklocka, men du vet att det är ett glas.
Denna till synes enkla förmåga för människor att känna igen delvis tilltäppta objekt-definierade i denna situation som effekten av ett objekt i ett 3D-utrymme som blockerar ett annat objekt från sikten-har varit ett komplicerat problem för datorsyngemenskapen. Martin Schrimpf, en doktorand i DiCarlo -labbet vid Institutionen för hjärna och kognitiva vetenskaper vid MIT, förklarar att maskiner har blivit allt bättre på att snabbt och säkert känna igen hela föremål, men när något täcker en del av det objektet ur sikte, denna uppgift blir allt svårare för modellerna att exakt känna igen artikeln.
"För modeller från datorsyn för att fungera i vardagen, de måste kunna smälta ockluderade föremål lika bra som hela - trots allt, när du ser dig omkring, de flesta föremålen är delvis dolda bakom ett annat objekt, "säger Schrimpf, medförfattare till ett papper om ämnet som nyligen publicerades i Förfaranden från National Academy of Sciences ( PNAS ).
I den nya studien, han säger, "vi grävde i de underliggande beräkningarna i hjärnan och använde sedan våra fynd för att bygga beräkningsmodeller. Genom att sammanfatta visuell bearbetning i den mänskliga hjärnan, Vi hoppas därför också kunna förbättra modellerna för datorsyn. "
Hur kan vi som människor upprepade gånger göra den här vardagliga uppgiften utan att lägga mycket tankar och energi på denna handling, identifiera hela scener snabbt och exakt efter att bara ha sett bitar? Forskare i studien började med den mänskliga visuella cortexen som en modell för hur man kan förbättra maskinernas prestanda i denna miljö, säger Gabriel Kreiman, en affiliate till MIT Center for Brains, Sinnen, och maskiner. Kreinman är professor i oftalmologi vid Boston Children's Hospital och Harvard Medical School och var huvudutredare för studien.
I deras papper, "Återkommande beräkningar för visuellt mönster, "laget visade hur de utvecklade en beräkningsmodell, inspirerad av fysiologiska och anatomiska begränsningar, som kunde fånga beteendemässiga och neurofysiologiska observationer under färdigställandet av mönstret. I slutet, modellen gav användbar insikt för att förstå hur man kan dra slutsatser från minimal information.
Denna artikel publiceras på nytt med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som täcker nyheter om MIT -forskning, innovation och undervisning.