Kredit:openai
Ett bokstäver, flerfärgat block:En trivial uppgift väntar på att människor ska plocka upp det, vänd på den, kasta runt den i vår handflata. För en robotexpert, fastän, detta är en uppförsbacke som är tuff att klättra. Handmanipulation för robotar har alltid varit en utmaning.
Ange Dactyl. En OpenAI-video publicerad i måndags, med titeln Learning Dexterity, visade stolt sitt robotsystem, Dactyl, som har skapats för att manipulera objekt – på ett förstklassigt sätt.
Tonvikten ligger på ordet skicklighet. Dess fingrar hanterar blocket på ett sätt som är ganska anmärkningsvärt, inklusive att skickligt vända blocket på dess olika sidor. Den lärde sig hur man roterar blocket till vilken orientering som helst.
De tränade ett konvolutionellt neuralt nätverk, sa IEEE spektrum Evan Ackerman, att styra en Shadow-hand för att manipulera objekt, på bara 50 timmar.
För att vara säker, den andra anledningen till att deras hand väckte intresse var att den bearbetades på kortare tid. Ackerman underströk betydelsen av tidsspån för robotteam. (Siffrorna är ödmjuka. IEEE spektrum nämnde 50 framgångsrika kubmanipulationer som resultatet av 6, 144 CPU-kärnor och 8 GPU:er som samlar in 100 års simulerad robotupplevelse på 50 timmar.)
Det tar människor år att uppnå "robusta" nivåer av handmanipulationer. Väl, robotar, sa Ackerman, "har inte den typen av tid. Att lära sig genom övning och erfarenhet är fortfarande vägen att gå för komplexa uppgifter som denna, och utmaningen är att hitta ett sätt att lära sig snabbare och mer effektivt än att bara ge en robot hand något att manipulera om och om igen tills den lär sig vad som fungerar och vad som inte fungerar, vilket förmodligen skulle ta ungefär hundra år."
Reuters beskrev på liknande sätt varför deras arbete är viktigt:"Fysisk träning tar månader eller år och har sina egna problem - till exempel, om en robothand tappar ett arbetsstycke, en människa behöver ta upp den och lägga tillbaka den. Det är dyrt också. Forskare har försökt skära upp dessa år av fysisk träning och distribuera dem till flera datorer för en mjukvarusimulering som kan göra träningen på timmar eller dagar, utan mänsklig hjälp."
En annan spännande aspekt pekades av Stephen Nellis i Reuters-artikeln. "Forskare injicerade slumpmässigt brus i mjukvarusimuleringen, gör robothandens virtuella värld så rörig att den inte blev förvirrad av det oväntade i den verkliga världen."
Genom att höja ribban vid handmanipulation, teamet hade lyckats täcka variationer som inte kan modelleras väl. Ackerman skrev, "Detta inkluderar föremålets massa och dimensioner, friktion av både föremålets yta och robotens fingertoppar, hur väl robotens leder är dämpade, ställdonets krafter, gemensamma gränser, motorspel och ljud, och mer."
I deras OpenAI-blogginlägg, teamet sa att de tränade en människoliknande robothand för att manipulera fysiska föremål "med aldrig tidigare skådad skicklighet." De noterade hur Dactyl tränades helt i simulering, "anpassa sig till den verkliga fysiken med hjälp av tekniker som vi har arbetat med det senaste året. Dactyl lär sig från grunden med samma generella förstärkningsinlärningsalgoritm och kod som OpenAI Five."
Det är möjligt att utbilda agenter i simulering och få dem att lösa verkliga uppgifter, de sa, utan fysiskt exakt modellering av världen.
© 2018 Tech Xplore