Brown University datorsexperter lär datorer att se kontextberoende optiska illusioner, i hopp om att hjälpa artificiella synalgoritmer att ta hänsyn till sammanhanget och vara mer robust. Upphovsman:Serre Lab/Brown University
Är den cirkeln grön eller grå? Är mittlinjerna raka eller lutade?
Optiska illusioner kan vara roliga att uppleva och debattera, men att förstå hur mänskliga hjärnor uppfattar dessa olika fenomen är fortfarande ett aktivt område för vetenskaplig forskning. För en klass av optiska illusioner, kallas kontextuella fenomen, dessa uppfattningar är kända för att bero på sammanhang. Till exempel, färgen du tror att en central cirkel är beror på färgen på den omgivande ringen. Ibland får den yttre färgen att den inre färgen verkar mer lik, till exempel en grannring som gör att en blå ring ser turkos ut - men ibland gör den yttre färgen att den inre färgen verkar mindre lik, som en rosa ring som får en grå cirkel att se grönaktig ut.
Ett team av Brown University -datorsynsexperter gick tillbaka till ruta ett för att förstå de neurala mekanismerna för dessa kontextuella fenomen. Deras studie publicerades den 20 september Psychological Review .
"Det växer enighet om att optiska illusioner inte är ett fel utan en funktion, "sa Thomas Serre, docent i kognitiv, språkliga och psykologiska vetenskaper vid Brown och tidningens seniorförfattare. "Jag tror att de är en funktion. De kan representera kantfall för vårt visuella system, men vår vision är så kraftfull i det dagliga livet och i att känna igen föremål. "
För studien, laget ledt av Serre, som är ansluten till Brown's Carney Institute for Brain Science, började med en beräkningsmodell begränsad av anatomiska och neurofysiologiska data från den visuella cortexen. Modellen syftade till att fånga hur närliggande kortikala neuroner skickar meddelanden till varandra och justerar varandras svar när de presenteras med komplexa stimuli som kontextuella optiska illusioner.
En innovation teamet inkluderade i deras modell var ett specifikt mönster av hypotetiserade återkopplingsförbindelser mellan neuroner, sa Serre. Dessa återkopplingsförbindelser kan öka eller minska - excitera eller hämma - svaret från en central neuron, beroende på det visuella sammanhanget.
Dessa återkopplingsanslutningar finns inte i de flesta djupinlärningsalgoritmer. Deep learning är en kraftfull sorts artificiell intelligens som kan lära sig komplexa mönster i data, som att känna igen bilder och analysera normalt tal, och beror på att flera lager av artificiella neurala nätverk arbetar tillsammans. Dock, de flesta djupinlärningsalgoritmer inkluderar bara feedforward -anslutningar mellan lager, inte Serres innovativa återkopplingsförbindelser mellan neuroner i ett lager.
När modellen väl konstruerades, laget presenterade det en mängd olika kontextberoende illusioner. Forskarna "justerade" styrkan i de återkopplande excitatoriska eller hämmande förbindelserna så att modellneuroner svarade på ett sätt som överensstämde med neurofysiologiska data från primatens visuella cortex.
Sedan testade de modellen på en mängd olika kontextuella illusioner och fann igen att modellen uppfattade illusionerna som människor.
För att testa om de gjorde modellen onödigt komplex, de skadade modellen och tog bort några av anslutningarna selektivt. När modellen saknade några av anslutningarna, data matchade inte människans uppfattningsdata lika exakt.
"Vår modell är den enklaste modellen som är både nödvändig och tillräcklig för att förklara beteendet hos den visuella cortexen när det gäller kontextuella illusioner, "Serre sa." Detta var verkligen lärobokens beräkningsneurovetenskapliga arbete - vi började med en modell för att förklara neurofysiologiska data och slutade med förutsägelser för mänskliga psykofysiska data. "
Förutom att ge en samlande förklaring till hur människor ser en klass av optiska illusioner, Serre bygger vidare på denna modell med målet att förbättra konstgjord syn.
Toppmoderna algoritmer för artificiell vision, som de som används för att märka ansikten eller känna igen stoppskyltar, har svårt att se sammanhang, noterade han. Genom att inkludera horisontella anslutningar avstämda av kontextberoende optiska illusioner, han hoppas att hantera denna svaghet.
Kanske kommer visuella djupinlärningsprogram som tar hänsyn till sammanhang att vara svårare att lura. En viss klistermärke, när den fastnar på ett stoppskylt kan lura ett artificiellt synsystem att tro att det är en hastighet på 65 kilometer i timmen, vilket är farligt, Sa Serre.