De som vet hur svårt det är att få robothänder att förstå, handtag och manövrering kommer att göra mer än bara en blick - stirra, snarare - vid den senaste videon som visar OpenAI Dactyl Rubiks kub.
Att arbeta med en robot med fyra fingrar och tummar är aldrig trivialt när utmaningen är att visa människoliknande fingerfärdighet. OpenAI:s hand vinner uppskattande utseende med sina skickliga fingermanipulationer som en mänsklig hand skulle behöva för att lösa kuben.
De som känner till OpenAI:s andra video som publicerades förra året skulle redan veta om deras framsteg, med videon dubbad Learning Dexterity. Videon handlade om hur de utbildade en mänsklig robothand för att manipulera fysiska föremål. Redan då kände de att de kunde skryta med att robothanden kunde göra detta med "aldrig tidigare skådad fingerfärdighet".
Det var så de introducerade sitt system, Daktyl. De sa att Dactyl lär sig från grunden med hjälp av en algoritm och kod för förstärkningsinlärning för allmänna ändamål. "Våra resultat visar att det är möjligt att utbilda agenter i simulering och få dem att lösa verkliga uppgifter, utan fysiskt noggrann modellering av världen. "
En maskininlärningsingenjör berättade för videoklippare att tekniken kallades domän randomisering.
De slumpmässigt hur snabbt handen kan röra sig, till exempel, och hur tungt blocket är, och friktionen mellan blocket och handen.
Två kommentarer från videon för ett år sedan trodde att det här inte var AI:"AI" är egentligen bara abstrakta algoritmer vid denna tidpunkt. Vi är inte ens nära att förstå vad intelligens är, än mindre hur man syntetiserar det. "
Den andra kommentaren:"Det här är inget annat än smart programmering ... ingen intelligens alls. Detta är helt enkelt en maskin som gör vad den har programmerats att göra i en runda om mode. Bara programmera saken för att vrida blocken på rätt sätt från början och spara lite tid och ansträngning ... En dator kommer bara någonsin att göra vad den är programmerad att göra. "
Fortfarande, Karen Hao in MIT Technology Review tyckte lagets robothand var ett viktigt steg mot mer smidiga robotar för industri- och konsumentapplikationer.
Snabbspolning fram till deras nya tidning, "Löser Rubiks kub med en robothand."
Författarna förklarade att "Vi visar att modeller som endast är utbildade i simulering kan användas för att lösa ett manipulationsproblem av oöverträffad komplexitet på en verklig robot. Detta möjliggörs av två nyckelkomponenter:en ny algoritm, som vi kallar automatisk domän randomisering (ADR) och en robotplattform byggd för maskininlärning. "
De pratade om deras kombinerade vändning och topprotation.
"En rotation motsvarar att rotera en enda yta i Rubiks kub med 90 grader medsols eller moturs. En vändning motsvarar att flytta en annan yta på Rubiks kub till toppen. Vi fann att det att rotera toppytan var långt enklare än att rotera andra ytor. istället för att rotera godtyckliga ansikten, vi kombinerar en flip och en toppytorotation för att utföra önskad operation. Dessa delmål kan sedan utföras sekventiellt för att så småningom lösa Rubiks kub. "
De tog upp alla misstankar om att de gav sig själva en orättvis fördel med en idealiskt krypterad kub.
"Svårigheten att lösa en Rubiks kub beror uppenbarligen på hur mycket den har krypterats tidigare. Vi använder den officiella krypteringsmetoden som används av World Cube Association för att få det de kallar en rättvis förvirring (cirka 20 drag som tillämpas på en löste Rubiks kub för att kryptera den).
Vad tyckte andra robotister om OpenAI -lagets hand på rulle med Rubiks pussel?
Hao citerade Dmitry Berenson, en robotist vid University of Michigan.
"Det här är ett riktigt svårt problem, "sa han." Den typ av manipulation som krävs för att rotera Rubiks kubs delar är faktiskt mycket svårare än att rotera en kub. "
Men vad menar teamet när de hänvisar till modeller som är utbildade i simulering? Karen Hao in MIT Technology Review sa att de bygger en virtuell modell av sin robot. De tränar det praktiskt taget för att klara uppgiften. "Algoritmen lär sig det digitala rymdets säkerhet och kan sedan portas in i en fysisk robot." Nu, nyckeln till deras framgång:Ho sa "labbet förvrängde de simulerade förhållandena i varje träningsomgång för att göra algoritmen mer anpassningsbar till olika möjligheter."
De använde (1) Shadow Dexterous E Series Hand som robothand, (2) PhaseSpace motion capture -systemet för att spåra de kartesiska koordinaterna för fingertopparna och (3) tre RGB Basler -kameror användes för uppskattning av synpositioner.
Vad kommer härnäst?
I en blogg, teammedlemmar uppgav att "Att lösa Rubiks kub med en robothand är fortfarande inte lätt. Vår metod löser för närvarande Rubiks kub 20% av tiden när vi applicerar en maximalt svår förvrängning som kräver 26 ansiktsrotationer. För enklare krypteringar som kräver 15 varv till ångra, framgångsgraden är 60%.
Ändå, OpenAI handlar inte om att gå bort från svårigheter. "Vi tror att fingerfärdighet på mänsklig nivå är på väg mot att bygga robotar för allmänna ändamål och vi är glada att fortsätta i denna riktning."
© 2019 Science X Network