DeepMind använder neurala nätverk för att förklara meta-lärande hos människor

Vår virtuella återskapande av Harlow-experimentet -- agenten måste flytta sin blick mot objektet som den tror är förknippat med en belöning. Kredit:DeepMind

Ett team av forskare ledda av en grupp vid Googles dotterbolag DeepMind har utvecklat en teori om hur mänskligt meta-lärande fungerar genom att jämföra det med en viss typ av djupinlärningsnätverk på datorer. I deras papper publicerad i tidskriften Naturens neurovetenskap , gruppen föreslår att nyckelelement i specialiserade datoriserade neurala nätverk kan likna dopamins funktion i hjärnan under meta-inlärning.

Deep learning nätverk, medan det är ganska imponerande när du springer, kommer fortfarande till korta på ett område – de tar mycket tid och ansträngning för att få upp farten. Ett färskt exempel skulle vara neurala nätverk programmerade för att spela gamla datorspel som Pong. En människa kan behärska grunderna och bli ganska skicklig efter att ha spelat bara en eftermiddag. Ett neuralt nätverk, å andra sidan, kräver hundratals timmars träning. Neuroforskare har föreslagit att denna skillnad beror på vad som kallas meta-inlärning - där en person (eller ett djur) lär sig hur man gör något nytt baserat på vad de lärt sig tidigare. apor, till exempel, kan lära sig att välja mellan olika objekt efter att först ha lärt sig att välja via slumpmässigt urval – något som upptäcktes som en del av Harlow-experimentet.

Forskare, som de på DeepMind, har på senare tid gjort framsteg för att få datorer att engagera sig i meta-lärande. Processen genom vilken de gör det är mycket väl förstådd, självklart, eftersom det är de som får det till. Hur det går till hos människor, fastän, är fortfarande inte klart. I denna nya ansträngning, teamet på DeepMind föreslår att en av nyckelfaktorerna för att få datorer att engagera sig i meta-lärande, kan likna något som finns i mänskliga neurala nätverk.

För att komma till denna slutsats, teamet utvecklade sex datorbaserade meta-inlärningsexperiment som ursprungligen var en del av neurovetenskapliga experiment på djur, en av dem var Harlow-experimentet. Forskarna fann att deras djupa neurala nätverkssvar liknade djurens i de ursprungliga experimenten. Vidare, de noterade att den vanliga ingrediensen som användes för vart och ett av experimenten var något som de kallade ett medel – det krävdes för att få metatypinlärning till stånd. Detta, de noterar, kan tyda på att djurs neurala nätverk har ett liknande biologiskt agens som är ansvarigt för att orsaka meta-inlärning. Och de föreslår att medlet kan vara signalsubstansen dopamin.

Den första trådlösa flygande robotinsekten lyfter

Nytt robotkoncept använder responsiva material för att simma genom vatten

Elektronik