Stanford-forskare testar två ramverk som, tillsammans, skulle kunna göra det snabbare och enklare att lära dessa robotarmar grundläggande färdigheter. Kredit:Stanford Vision and Learning Lab
I källaren i Gates Computer Science Building vid Stanford University, en skärm fäst vid en röd robotarm lyser upp. Ett par tecknade ögon blinkar. "Möt Bender, " säger Ajay Mandlekar, Ph.D. student i elektroteknik.
Bender är en av robotarmarna som ett team av Stanford-forskare använder för att testa två ramverk som, tillsammans, skulle kunna göra det snabbare och enklare att lära robotar grundläggande färdigheter. RoboTurk-ramverket tillåter människor att rikta robotarmarna i realtid med en smartphone och en webbläsare genom att visa roboten hur man utför uppgifter som att plocka upp föremål. SURREAL påskyndar inlärningsprocessen genom att köra flera upplevelser samtidigt, i huvudsak låter robotarna lära sig av många erfarenheter samtidigt.
"Med RoboTurk och SURREAL, vi kan tänja på gränsen för vad robotar kan göra genom att kombinera massor av data som samlats in av människor och koppla det med storskalig förstärkningsinlärning, sade Mandlekar, en medlem i teamet som utvecklade ramarna.
Gruppen kommer att presentera RoboTurk och SURREAL 29 oktober vid konferensen om robotinlärning i Zürich, Schweiz.
Människor som lär ut robotar
Yuke Zhu, en Ph.D. student i datavetenskap och en medlem av teamet, visade hur systemet fungerar genom att öppna appen på sin iPhone och vifta med den genom luften. Han styrde robotarmen – som en mekanisk kran i ett arkadspel – att sväva över sitt pris:ett träblock målat för att se ut som en biff. Detta är en enkel plocka-och-place-uppgift som involverar att identifiera objekt, plocka upp dem och lägga dem i papperskorgen med rätt etikett.
Till människor, uppgiften verkar löjligt lätt. Men för dagens robotar, det är ganska svårt. Robotar lär sig vanligtvis genom att interagera med och utforska sin miljö – vilket vanligtvis resulterar i många slumpmässiga armviftningar – eller från stora datamängder. Ingen av dessa är lika effektiv som att få lite mänsklig hjälp. På samma sätt som föräldrar lär sina barn att borsta tänderna genom att styra sina händer, människor kan visa för robotar hur man gör specifika uppgifter.
Dock, de lektionerna är inte alltid perfekta. När Zhu tryckte hårt på sin telefonskärm och roboten släppte sitt grepp, trästeken träffade kanten på soptunnan och smattrade på bordet. "Människor är inte på något sätt optimala på detta, " sade Mandlekar, "men den här upplevelsen är fortfarande integrerad för robotarna."
Snabbare inlärning parallellt
Dessa försök – även misslyckandena – ger ovärderlig information. Demonstrationer som samlats in genom RoboTurk kommer att ge robotarna bakgrundskunskap för att kickstarta deras lärande. SURREAL kan köra tusentals simulerade upplevelser av människor över hela världen samtidigt för att påskynda inlärningsprocessen.
"Med SURREAL, vi vill påskynda denna process av interaktion med miljön, " sa Linxi Fan, en Ph.D. student i datavetenskap och medlem i teamet. Dessa ramverk ökar drastiskt mängden data för robotarna att lära sig av.
"De kombinerade dubbla ramverken kan tillhandahålla en mekanism för AI-assisterad mänsklig utförande av uppgifter där vi kan föra människor bort från farliga miljöer samtidigt som vi behåller en liknande nivå av uppgiftsutförande, " sa postdoktor Animesh Garg, en medlem i teamet som utvecklade ramarna.
Teamet föreställer sig att robotar kommer att vara en integrerad del av vardagen i framtiden:hjälpa till med hushållssysslor, utföra upprepade monteringsuppgifter vid tillverkning eller slutföra farliga uppgifter som kan utgöra ett hot mot människor.
"Du ska inte behöva säga åt roboten att vrida sin arm 20 grader och tum framåt 10 centimeter, " sa Zhu. "Du vill kunna säga åt roboten att gå till köket och hämta ett äpple."