Jenga! #RoboFail. Upphovsman:Fazeli et al., Sci. Robot. 4, eaav3123 (2019)
I källaren i MIT:s byggnad 3, en robot överväger noggrant sitt nästa drag. Det petar försiktigt på ett torn av block, letar efter det bästa blocket att extrahera utan att välta tornet, i en ensamhet, långsamt, men förvånansvärt smidigt spel Jenga.
Roboten, utvecklad av MIT -ingenjörer, är utrustad med en mjuktappad gripare, en kraftkännande handledsmanschett, och en extern kamera, allt det använder för att se och känna tornet och dess enskilda block.
När roboten försiktigt trycker mot ett block, en dator tar in visuell och taktil återkoppling från kameran och manschetten, och jämför dessa mätningar med rörelser som roboten tidigare gjort. Den beaktar också resultaten av dessa drag - särskilt om ett block, i en viss konfiguration och pressad med en viss mängd kraft, extraherades framgångsrikt eller inte. I realtid, roboten "lär sig" om den ska fortsätta att trycka eller flytta till ett nytt block, för att tornet inte ska falla.
Detaljer om den Jenga-spelande roboten publiceras i tidskriften Science Robotics . Alberto Rodriguez, Walter Henry Gale Karriärutvecklingsassistent vid Institutionen för maskinteknik vid MIT, säger roboten visar något som har varit svårt att uppnå i tidigare system:förmågan att snabbt lära sig det bästa sättet att utföra en uppgift, inte bara från visuella signaler, som det vanligtvis studeras idag, men också från taktil, fysiska interaktioner.
"Till skillnad från mer rent kognitiva uppgifter eller spel som schack eller Go, att spela Jenga kräver också behärskning av fysiska färdigheter som sondering, tryckande, dragande, placering, och justera bitar. Det kräver interaktiv uppfattning och manipulation, dit du måste gå och röra tornet för att lära dig hur och när du ska flytta block, "Säger Rodriguez." Det här är väldigt svårt att simulera, så roboten måste lära sig i den verkliga världen, genom att interagera med det riktiga Jenga -tornet. Den viktigaste utmaningen är att lära av ett relativt litet antal experiment genom att utnyttja sunt förnuft om objekt och fysik. "
Han säger att det taktila inlärningssystem som forskarna har utvecklat kan användas i applikationer bortom Jenga, särskilt i uppgifter som kräver noggrann fysisk interaktion, inklusive att separera återvinningsbara föremål från soptippar och montera konsumentprodukter.
"I en mobiltelefons samlingslinje, i nästan varje steg, känslan av en snap-fit, eller en gängad skruv, kommer från kraft och beröring snarare än syn, "Säger Rodriguez." Inlärningsmodeller för dessa åtgärder är främsta fastigheter för denna typ av teknik. "
Tidningens huvudförfattare är MIT -doktorand Nima Fazeli. I teamet ingår också Miquel Oller, Jiajun Wu, Zheng Wu, och Joshua Tenenbaum, professor i hjärn- och kognitiv vetenskap vid MIT.
Knuffa och dra
I spelet Jenga - Swahili för "bygga" - staplas 54 rektangulära block i 18 lager om tre block vardera, med blocken i varje lager orienterade vinkelrätt mot blocken nedan. Målet med spelet är att noggrant extrahera ett block och placera det på toppen av tornet, på så sätt bygga en ny nivå, utan att störta hela strukturen.
För att programmera en robot för att spela Jenga, traditionella maskininlärningssystem kan kräva att fånga allt som eventuellt kan hända mellan ett block, roboten, och tornet-en dyr beräkningsuppgift som kräver data från tusentals om inte tiotusentals blockekstraktionsförsök.
Istället, Rodriguez och hans kollegor letade efter ett mer dataeffektivt sätt för en robot att lära sig spela Jenga, inspirerad av mänsklig kognition och hur vi själva kan närma oss spelet.
Teamet anpassade en industristandard ABB IRB 120 robotarm, sätt sedan upp ett Jenga -torn inom robotens räckvidd, och inledde en träningsperiod där roboten först valde ett slumpmässigt block och en plats på blocket att trycka mot. Den utövade sedan en liten mängd kraft i ett försök att skjuta ut blocket ur tornet.
För varje blockförsök, en dator registrerade tillhörande visuella och kraftmätningar, och märkte om varje försök var framgångsrikt.
I stället för att utföra tiotusentals sådana försök (vilket skulle innebära att rekonstruera tornet nästan lika många gånger), roboten tränade på ungefär 300, med försök med liknande mätningar och resultat grupperade i kluster som representerar vissa blockbeteenden. Till exempel, ett kluster av kan representera försök på ett block som var svårt att flytta, kontra en som var lättare att flytta, eller som störtade tornet när det flyttades. För varje datakluster, roboten utvecklade en enkel modell för att förutsäga ett block beteende med tanke på dess nuvarande visuella och taktila mätningar.
Fazeli säger att denna klusterteknik dramatiskt ökar effektiviteten med vilken roboten kan lära sig att spela spelet, och är inspirerad av det naturliga sättet på vilket människor kluster liknande beteende:"Roboten bygger kluster och lär sig sedan modeller för var och en av dessa kluster, istället för att lära sig en modell som fångar absolut allt som kan hända. "
Staplar upp
Forskarna testade deras tillvägagångssätt mot andra toppmoderna maskininlärningsalgoritmer, i en datasimulering av spelet med hjälp av simulatorn MuJoCo. Lärdomarna i simulatorn informerade forskarna om hur roboten skulle lära sig i den verkliga världen.
Jenga-spelande robot. Upphovsman:Fazeli et al., Sci. Robot. 4, eaav3123 (2019)
"Vi tillhandahåller dessa algoritmer samma information som vårt system får, för att se hur de lär sig att spela Jenga på en liknande nivå, "Säger Oller." Jämfört med vårt tillvägagångssätt, dessa algoritmer måste utforska storleksordningar fler torn för att lära sig spelet. "
Nyfiken på hur deras maskininlärningssätt fungerar mot verkliga mänskliga spelare, laget genomförde några informella försök med flera volontärer.
"Vi såg hur många block en människa kunde extrahera innan tornet föll, och skillnaden var inte så stor, Säger Oller.
Men det finns fortfarande en väg att gå om forskarna konkurrenskraftigt vill ställa sin robot mot en mänsklig spelare. Förutom fysiska interaktioner, Jenga kräver strategi, som att extrahera precis det rätta blocket som kommer att göra det svårt för en motståndare att dra ut nästa block utan att välta tornet.
Tills vidare, laget är mindre intresserat av att utveckla en robotjengamästare, och mer fokuserad på att tillämpa robotens nya färdigheter på andra applikationsdomäner.
"Det finns många uppgifter som vi gör med våra händer där känslan av att göra det" på rätt sätt "kommer på krafternas språk och taktila ledtrådar, "Säger Rodriguez." För sådana här uppgifter, ett liknande tillvägagångssätt som vårt kan räkna ut det. "
Denna forskning fick stöd, till viss del, av National Science Foundation genom National Robotics Initiative.