• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • En generativ minnesmetod för att möjliggöra livslångt förstärkningslärande

    Kredit:Raghavan, Hostetler &Chai.

    En viktig begränsning av existerande artificiell intelligens (AI)-system är att de inte kan hantera uppgifter som de inte har utbildats för. Faktiskt, även när de omskolas, majoriteten av dessa system är benägna att 'katastrofalt glömma, ' vilket i huvudsak innebär att ett nytt föremål kan störa deras tidigare förvärvade kunskaper.

    Till exempel, om en modell initialt tränas för att slutföra uppgift A och sedan omskolas till uppgift B, dess prestanda på uppgift A kan minska avsevärt. En naiv lösning skulle vara att oändligt lägga till fler neurala lager för att stödja ytterligare uppgifter eller föremål som tränas, men ett sådant tillvägagångssätt skulle inte vara effektivt, eller till och med funktionellt skalbar.

    Forskare vid SRI international har nyligen försökt tillämpa biologiska minnesöverföringsmekanismer på AI-system, eftersom de tror att detta kan förbättra deras prestanda och göra dem mer anpassningsbara. Deras studie, förpublicerad på arXiv, hämtar inspiration från mekanismer för minnesöverföring hos människor, såsom långtids- och korttidsminne.

    "Vi bygger en ny generation av AI-system som kan lära av erfarenheter, "Sek Chai, en co-PI för projektet DARPA Lifelong Learning Machines (L2M), berättade för TechXplore. "Detta innebär att de kan anpassa sig till nya scenarier baserat på sina erfarenheter. Idag, AI-system misslyckas eftersom de inte är adaptiva. DARPA L2M -projektet, ledd av Dr. Hava Siegelmann, strävar efter att uppnå paradigmförändrande framsteg inom AI-kapacitet."

    Kredit:Raghavan, Hostetler &Chai.

    Minneöverföring innebär en komplex sekvens av dynamiska processer, som gör att människor enkelt kan komma åt framträdande eller relevanta minnen när de tänker, planera, skapa eller göra förutsägelser om framtida händelser. Sömn anses spela en avgörande roll för att stärka minnen, speciellt REM-sömn, det stadium där drömmar förekommer oftast.

    I deras studie, Chai och hans SRI-kollegor utvecklade en generativ minnesmekanism som kan användas för att träna AI-system på ett pseudo-repetitionssätt. Använda replay och förstärkningsinlärning (RL), denna mekanism gör att AI-system kan lära sig av framträdande minnen under hela sin livstid, och skala med ett stort antal träningsuppgifter eller objekt. Den generativa minnesstrategin som utvecklats av Chai och hans kollegor använder en kodningsmetod för att separera det latenta utrymmet. Detta gör att ett AI-system kan lära sig även när uppgifter inte är väldefinierade eller när antalet uppgifter är okänt.

    "Vårt AI -system lagrar inte rådata direkt, som video, audio, etc., Chai förklarade. vi använder generativt minne för att generera eller föreställa oss vad det har upplevt tidigare. Generativa AI-system har använts för att skapa konst, musik, etc. I vår forskning, vi använder dem för att koda generativa upplevelser som kan användas senare med förstärkningslärande. Ett sådant tillvägagångssätt är inspirerat av biologiska mekanismer i sömn och drömmar, där vi minns eller föreställer oss fragment av upplevelser som förstärks i våra långtidsminnen."

    I framtiden, den nya generativa minnesmetoden som introducerats av Chai och hans kollegor kan hjälpa till att ta itu med frågan om katastrofal glömning i neurala nätverksbaserade modeller, möjliggör livslångt lärande i AI-system. Forskarna testar nu sitt tillvägagångssätt på datorbaserade strategispel som vanligtvis används för att träna och utvärdera AI-system.

    "Vi använder strategispel i realtid som StarCraft2 för att träna och studera våra AI-agenter om livslångt lärande, såsom anpassning, robusthet, och säkerhet, " Sa Chai. "Våra AI-agenter är tränade med överraskningar injicerade i spelet (t.ex. terräng- och enhetskapacitetsförändringar)."

    © 2019 Science X Network




    © Vetenskap https://sv.scienceaq.com