• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • En imitationsinlärningsmetod för att träna robotar utan behov av riktiga mänskliga demonstrationer

    Figur som förklarar hur den inlärningsmetod som föreslagits av forskarna fungerar. Kredit:Bonardi, James och Davison.

    De flesta människor kan lära sig hur man slutför en viss uppgift genom att observera en annan person utföra den bara en gång. Robotar som är programmerade att lära sig genom att imitera människor, dock, behöver vanligtvis tränas i en serie mänskliga demonstrationer innan de effektivt kan återskapa det önskade beteendet.

    Forskare kunde nyligen lära robotar att utföra nya uppgifter genom att låta dem observera en enda mänsklig demonstration, använda meta-inlärningsmetoder. Dock, dessa inlärningstekniker kräver vanligtvis verkliga data som kan vara dyra och svåra att samla in.

    För att övervinna denna utmaning, ett team av forskare vid Imperial College London har utvecklat ett nytt tillvägagångssätt som möjliggör one-shot imitationsinlärning i robotar utan behov av mänskliga demonstrationer i verkligheten. Deras tillvägagångssätt, presenteras i en tidning förpublicerad på arXiv, använder algoritmer som kallas task-embedded control networks (TecNets), som tillåter artificiella medel att lära sig hur man slutför uppgifter från en enstaka eller flera demonstrationer, samt artificiellt genererade träningsdata.

    "Vi visar att med uppgiftsinbäddade kontrollnätverk, vi kan dra slutsatser om kontrollpolicyer genom att bädda in mänskliga demonstrationer som kan villkora en kontrollpolicy och uppnå en imitationsinlärning, " skriver forskarna i sin uppsats.

    Det tillvägagångssätt som forskarna presenterar kräver ingen interaktion med riktiga människor under robotens träning. Metoden använder TechNets för att härleda kontrollpolicyer, inbäddning av mänskliga demonstrationer som kan villkora en given kontrollpolicy och i slutändan möjliggöra engångsinlärning.

    För att ta bort behovet av mänskliga demonstrationer under träning, forskarna använde en datauppsättning av videor som simulerade mänskliga demonstrationer, som de genererade med PyRep, en nyligen släppt verktygslåda för forskning om robotinlärning. Med PyRep, forskarna modellerade en människoliknande 3D-arm och bröt ner den i former för att återskapa rörelser som liknar de som observerats hos människor.

    De skapade sedan en datauppsättning bestående av videor där denna simulerade arm utförde ett antal uppgifter och använde den för att träna ett robotsystem. I sista hand, roboten kunde lära sig hur man slutför en uppgift bara genom att analysera dessa simuleringsvideor och en enda mänsklig demonstration i den verkliga världen.

    "Viktigt, vi använder inte en riktig mänsklig arm för att ge demonstrationer under träning, utan istället utnyttja domänrandomisering i en applikation som inte har setts tidigare:sim-till-verklig överföring på människor, " förklarar forskarna i sin uppsats.

    Teamet utvärderade den nya inlärningsmetoden både i simuleringar och i den verkliga världen, använda den för att träna en robot att utföra uppgifter som involverade att placera och skjuta föremål. Anmärkningsvärt, deras inlärningsmetod uppnådde resultat som var jämförbara med dem som uppnåddes med en mer konventionell inlärningsbaserad imitationsmetod, även om det innebär att träna en robot på artificiellt genererade videor snarare verkliga mänskliga demonstrationer.

    Forskarna skriver, "Vi kunde uppnå liknande prestanda som en toppmodern alternativ metod som bygger på tusentals träningsdemonstrationer som samlats in i den verkliga världen, samtidigt som de förblir robusta mot visuella domänskiften, till exempel väsentligt olika bakgrunder."

    Tillvägagångssättet som utvecklats av detta team av forskare kan möjliggöra engångsinlärning imitation för ett antal robotar utan att behöva samla in stora mängder mänskliga demonstrationer i verkligheten. Detta kan spara mycket ansträngning, resurser och tid för dem som försöker träna robotar med hjälp av imitationsinlärning. Forskarna planerar nu att undersöka andra åtgärder som robotar skulle kunna tränas i att använda deras tillvägagångssätt.

    "Vi hoppas att ytterligare undersöka mångfalden av mänskliga handlingar som kan överföras från simulering till verklighet, " skrev forskarna i sin uppsats. "T.ex. i det här arbetet, vi har visat att en mänsklig arm kan överföras, men skulle samma metod fungera från demonstrationer som inkluderar hela bålen på en människa?"

    © 2019 Science X Network




    © Vetenskap https://sv.scienceaq.com