Upphovsman:CC0 Public Domain
Optiska illusioner, bilder som lurar det mänskliga ögat, är ett fascinerande forskningsämne, som att studera dem kan ge värdefull insikt i mänsklig kognition och uppfattning. Forskare vid Flinders University, i Australien, har nyligen genomfört en mycket intressant studie med hjälp av en datorvisionsmodell för att förutsäga förekomsten av optiska illusioner och graden av deras effekt.
Under det senaste decenniet har forskare har uppnått en allt mer detaljerad biologisk förståelse för hur den mänskliga hjärnan bearbetar visuella stimuli. Många befintliga datorsynmodeller hämtar inspiration från vår nuvarande förståelse för visuell bearbetning. Ändå, vissa aspekter av visuell bearbetning är fortfarande dåligt förstådda och mycket debatterade.
"Visuell bearbetning börjar med känslorna av de retinala mottagliga fälten (RF) av det inkommande ljuset i ögonen, "förklarade forskarna i sin artikel, som förpublicerades på arXiv. "Retinala ganglionceller (RGC) är retinala utgångsneuroner som omvandlar synaptisk ingång från det inre plexiforma skiktet (IPL) och bär den visuella signalen till hjärnan. RGC -typernas mångfald och storleksberoendet för varje specifik typ till excentriciteten ( avståndet från fovea) är fysiologiska bevis för multiskala kodning av den visuella scenen i näthinnan. Lågnivåberäkningsmodeller för näthinnesyn har föreslagits baserat på samtidig provtagning av den visuella scenen i flera skalor. "
Tidigare forskning har introducerat en modell för att upptäcka illusoriska lutningar i Café Wall -illusionen, som härrör från kontrasten mellan bakgrund och lutande signaler. I deras studie, forskarna vid Flinders University generaliserade detta tillvägagångssätt, för att täcka ett bredare spektrum av geometriska illusioner, liksom mer komplexa kakel illusioner.
"Vi undersöker svaret från en enkel bioplausibel modell av lågnivåsyn på geometriska/kakel illusioner, återger missuppfattningen av deras geometri, som vi rapporterade för Café Wall och några kakel illusioner, "forskarna skrev i sitt papper." Modellen har hittills inte verifierats för att generalisera till dessa andra illusioner, och det här är vad vi visar i den här artikeln. "
I deras studie, forskarna utvärderade en beräknande filtreringsmodell som är utformad för att modellera lateral inhibering av retinala ganglionceller och deras svar på olika geometriska illusioner. Genom att anta detta tillvägagångssätt, forskarna hoppades kunna uppnå en bättre förståelse av dessa illusioner, förutsäga graden av deras effekt.
"Även om missuppfattningen av orientering i lutningsillusioner i allmänhet kan föreslå fysiologiska förklaringar som involverar selektiva orienteringsceller i cortex, vårt arbete ger bevis för en teori om att tiltens uppkomst i dessa mönster initieras innan vi når orienteringsselektiva celler, som ett resultat av den kända mekanismen för kodning av retinal/kortikal enkel cell, "förklarade forskarna.
Övergripande, resultaten som samlats in i denna studie tyder på att skillnader i Gauss (DoG), ett filter som upptäcker kanter i bilder, i flera skalor kan hjälpa till att förklara den inducerade lutningen i kakel illusioner och kan också hjälpa till att avslöja några av de illusoriska ledtrådar som uppfattas när man tittar på geometriska illusioner. Dessutom, forskarna kunde koppla bottom-up-processer till högre uppfattning och kognition, på ett sätt som överensstämmer med David Marrs teori om syn och kantdetektering.
Nuvarande datorsynmodeller för analys av geometriska illusioner är ganska komplexa, därför kan de vara svårare att tillämpa i forskningsstudier. Enligt forskarna, framtida studier bör försöka utforma mindre sofistikerade och mer biologiskt trovärdiga metoder för att upptäcka visuella signaler.
"Vi tror att ytterligare utforskning av rollen för enkla Gaussian-liknande modeller inom retinal behandling på låg nivå, och gaussiska kärnor i tidiga skede DNN, och dess förutsägelse om förlust av perceptuell illusion kommer att leda till mer exakta datorsynstekniker och modeller och kan potentiellt styra datorsyn mot eller bort från de funktioner som människor upptäcker, "forskarna skrev." Dessa effekter kan, i tur och ordning, förväntas bidra till högre nivåer av djup- och rörelsebearbetning och generaliseras till datorförståelse av naturliga bilder. "
© 2019 Science X Network