Ett fordon manövreras in på en parkeringsplats av ett litet neuralt nätverk. Kredit:Wiens tekniska universitet
Datavetare vid TU Wien (Wien) förbättrar artificiell intelligens genom att hämta inspiration från biologi. De nya metoderna ger fantastiska resultat med förvånansvärt lite ansträngning.
En naturligt odlad hjärna fungerar helt annorlunda än ett vanligt datorprogram. Den använder inte kod som består av tydliga logiska instruktioner, det är ett nätverk av celler som kommunicerar med varandra. Att simulera sådana nätverk på en dator kan hjälpa till att lösa problem som är svåra att bryta ner i logiska operationer.
Vid TU Wien (Wien), i samarbete med forskare vid Massachusetts Institute of Technology (MIT), ett nytt tillvägagångssätt för programmering av sådana neurala nätverk har nu utvecklats, som modellerar nervsignalernas tidsutveckling på ett helt annat sätt. Den var inspirerad av en särskilt enkel och väl undersökt varelse, spolmasken C. elegans. Neurala kretsar från dess nervsystem simulerades på datorn, och sedan anpassades modellen med maskininlärningsalgoritmer. Den här vägen, det var möjligt att lösa anmärkningsvärda uppgifter med ett extremt lågt antal simulerade nervceller – till exempel att parkera en bil. Även om det maskinspirerade nätverket bara består av 12 neuroner, den kan tränas att styra en roverrobot till en given plats. Ramin Hasani från Institutet för datateknik vid TU Wien har nu presenterat sitt arbete på TEDx-konferensen i Wien den 20 oktober.
Det kan visas att dessa nya neurala nätverk är extremt mångsidiga. En annan fördel är att deras interna dynamik kan förstås - i motsats till vanliga artificiella neurala nätverk, som ofta betraktas som en användbar men outgrundlig "svart låda".
Det neurala nätet:olika lager av sammankopplade neuroner. Kredit:Wiens tekniska universitet
Signaler i förgrenade nät
"Neurala nätverk måste tränas", säger Ramin Hasani. "Du tillhandahåller en specifik ingång och justerar anslutningarna mellan neuronerna så att den önskade effekten levereras."
Ingången, till exempel, kan vara ett fotografi, och utgången kan vara namnet på personen på bilden. "Tid spelar vanligtvis ingen viktig roll i denna process, säger Radu Grosu från Institutet för datorteknik vid TU Wien. För de flesta neurala nätverk, all input levereras på en gång, omedelbart resulterar i en viss utgång. Men i naturen är saker och ting väldigt olika.
Taligenkänning, till exempel, är alltid tidsberoende, liksom samtidiga översättningar eller sekvenser av rörelser som reagerar på en föränderlig miljö. "Sådana uppgifter kan hanteras bättre med det vi kallar RNN, eller återkommande neurala nätverk", säger Ramin Hasani. "Det här är en arkitektur som kan fånga sekvenser, eftersom det får neuroner att minnas vad som hände tidigare."
Hasani och hans kollegor föreslår en ny RNN-arkitektur baserad på en biofysisk neuron- och synapsmodell som tillåter tidsvarierande dynamik. "I en standard RNN-modell, det finns en konstant koppling mellan neuron ett och neuron två, definiera hur starkt aktiviteten hos neuron ett påverkar aktiviteten hos neuron två", säger Ramin Hasani. "I vår roman RNN-arkitektur, denna länk är en icke-linjär funktion av tid."
Maskhjärnan som kan parkera en bil
Att tillåta cellaktiviteter och länkar mellan celler att variera över tid öppnar helt nya möjligheter. Ramin Hasani, Mathias Lechner och deras medarbetare visade teoretiskt att deras arkitektur kan, i princip, ungefärlig godtycklig dynamik. För att visa mångsidigheten i det nya tillvägagångssättet, de utvecklade och tränade ett litet neuralt nätverk:"Vi återupprättade en neural krets från nervsystemet av nematoden C. elegans. Den är ansvarig för att generera ett enkelt reflexivt beteende - beröringsborttagande, säger Mathias Lechner, som nu arbetar vid Institute of Science and Technology (IST) Österrike. "Detta neurala nätverk simulerades och tränades för att styra verkliga applikationer."
Framgången är anmärkningsvärd:den lilla, enkelt nätverk med endast 12 neuroner kan (efter lämplig träning) lösa utmanande uppgifter. Till exempel, den tränades att manövrera ett fordon in på en parkeringsplats längs en fördefinierad väg. "Utgången från det neurala nätverket, som i naturen skulle kontrollera rörelsen av nematodmaskar, används i vårt fall för att styra och accelerera ett fordon", säger Hasani. "Vi har teoretiskt och experimentellt visat att våra nya neurala nätverk kan lösa komplexa uppgifter i verkliga livet och i simulerade fysiska miljöer."
Det nya tillvägagångssättet har en annan viktig fördel:den ger en bättre insikt i det neurala nätverkets inre funktioner. Tidigare neurala nätverk, som ofta bestod av tusentals noder, har varit så komplexa att endast de slutliga resultaten kunde analyseras. Att få en djupare förståelse för vad som pågår inuti var knappast möjligt. Det mindre men extremt kraftfulla nätverket i Wien-teamet är lättare att analysera, och så kan forskare åtminstone delvis förstå, vilka nervceller som orsakar vilka effekter. "Detta är en stor fördel som uppmuntrar oss att ytterligare undersöka deras egenskaper", säger Hasani.
Självklart, detta betyder inte att bilar kommer att parkeras av konstgjorda maskar i framtiden, men det visar att artificiell intelligens med en mer hjärnliknande arkitektur kan vara mycket kraftfullare än man tidigare trott.