Kredit:Berscheid, Meissner &Kröger.
När människor sträcker sig ut för att fatta ett visst föremål, de behöver ofta skjuta skräpet ur vägen för att isolera det och se till att det finns tillräckligt med utrymme att plocka upp det. Även om människor inte alltid är fullt medvetna om att de gör det, denna strategi, känd som "förhandsgreppsmanipulation, " tillåter dem att greppa föremål mer effektivt.
På senare år har flera forskare har försökt reproducera mänskliga manipulationsstrategier i robotar, ännu färre studier har fokuserat på manipulation före grepp. Med detta i åtanke, ett team av forskare vid Karlsruhe Institute of Technology (KIT) har nyligen utvecklat en algoritm som kan användas för att träna robotar i både gripande och pre-gripande manipulationsstrategier. Detta nya tillvägagångssätt presenterades i ett förpublicerat dokument på arXiv.
"Medan att greppa är en välkänd uppgift inom robotik, riktad manipulation före grepp är fortfarande mycket utmanande, "Lars Berscheid, en av forskarna som genomförde studien, berättade för TechXplore. "Detta gör det mycket svårt för robotar att greppa föremål ur röran eller trånga utrymmen för tillfället. Men, med de senaste innovationerna inom maskin- och robotinlärning, robotar kan lära sig att lösa olika uppgifter genom att interagera med sin omgivning. I den här studien, vi ville tillämpa ett tillvägagångssätt som vi presenterade i vårt tidigare arbete, inte bara för att förstå, men till manipulation i förväg också."
Kredit:Berscheid, Meissner &Kröger.
När en robot lär sig att utföra en viss uppgift, det måste i huvudsak ta reda på hur man löser ett problem genom att maximera dess belöningar. I sin studie, forskarna fokuserade på en uppgift som innebar att greppa föremål ur en slumpmässigt fylld papperskorg.
Roboten tränades i hur man greppar föremål i cirka 80 timmar, med hjälp av input från en kamera och feedback från dess gripdon. När den lyckades hålla ett föremål i sin robotgripare, den fick en belöning. Algoritmen som utvecklats av Berscheid och hans kollegor tar robotens träning ett steg längre, så att den också kan bli användbar för att förstå manipulationsstrategier, som att växla eller trycka.
"Nyckelidén med vårt arbete var att utöka greppfunktionerna genom att införa ytterligare växlings- eller tryckrörelser, " Berscheid förklarade. "Roboten kan sedan bestämma vilken åtgärd som ska tillämpas i olika situationer. Att träna robotar i verkligheten är väldigt knepigt:För det första, det tar lång tid, så själva utbildningen måste vara automatiserad och självövervakad, och för det andra kan många oväntade saker hända om roboten utforskar sin miljö. I likhet med andra tekniker inom maskininlärning, robotinlärning begränsas alltid av dess dataförbrukning. Med andra ord, vårt arbete är kopplat till två mycket utmanande forskningsfrågor:Hur kan en robot lära sig så snabbt som möjligt – och vilka uppgifter kan en robot lära sig med hjälp av de upptäckta insikterna?"
Kredit:Berscheid, Meissner &Kröger.
Som Berscheid fortsätter med att förklara, en robot kan lära sig mer effektivt om den får direkt feedback efter varje åtgärd den utför, eftersom detta övervinner frågan om sparsamma belöningar. Med andra ord, ju mer feedback som ges till en robot (dvs. desto mer belöning får den för framgångsrika handlingar), desto snabbare och mer effektivt lär den sig hur man slutför en given uppgift.
"Det här låter lätt, men ibland är det svårt att implementera:t.ex. hur definierar du kvaliteten på en manipulation före greppet?" sa Berscheid.
Det tillvägagångssätt som forskarna föreslagit bygger på en tidigare studie som undersökte användningen av skillnader i att förstå sannolikheter före och efter en viss handling, fokusera på ett litet område runt där åtgärden utförs. I deras nya studie, Berscheid och hans kollegor försökte också avslöja handlingar som en robot borde försöka lära sig så snabbt som möjligt.
"Detta är det välkända problemet med utforskning inom robotinlärning, " Berscheid förklarade. "Vi definierar en prospekteringsstrategi som antingen maximerar självinformationen eller minimerar osäkerheten i åtgärder och som kan beräknas mycket effektivt."
Algoritmen som presenteras av forskarna gör det möjligt för en robot att lära sig den optimala ställningen för grepp före grepp som att klämma eller växla, samt hur man utför dessa åtgärder för att öka sannolikheten för framgångsrikt grepp. Deras tillvägagångssätt gör att en viss handling (dvs. skiftande) är beroende av den andra (dvs. greppa), vilket i slutändan tar bort behovet av sparsamma belöningar och möjliggör ett effektivare lärande.
Forskarna tillämpade sin algoritm på en Franka-robotarm och utvärderade sedan dess prestanda på en uppgift som går ut på att plocka upp föremål från en soptunna tills den är helt tom. De tränade systemet med 25, 000 olika grepp och 2, 500 skiftåtgärder. Deras resultat var mycket lovande, med robotarmen som lyckades greppa och fila både föremål som den var bekant med och andra som den aldrig hade stött på tidigare.
"Jag tycker att två resultat av vårt arbete är särskilt spännande, Berscheid sa. "Först, vi tycker att detta arbete verkligen visar förmågan hos robotinlärning. Istället för att programmera hur man gör något, vi talar om för roboten vad den ska göra – och den måste ta reda på hur den ska göra det själv. I detta avseende vi kunde tillämpa och generalisera de metoder som vi har utvecklat för att greppa mot manipulation före grepp. För det andra och av mer praktisk relevans, detta kan vara mycket användbart vid automatisering av många industriella uppgifter, speciellt för soplock, där roboten ska kunna tömma soptunnan helt på egen hand."
I framtiden, tillvägagångssättet som utvecklats av Berscheid och hans kollegor skulle kunna tillämpas på andra robotplattformar, förbättra sina färdigheter för att förstå och förstå manipulation. Forskarna planerar nu att genomföra ytterligare studier för att utforska andra forskningsfrågor.
Till exempel, Hittills tillåter deras tillvägagångssätt bara Franks robotarm att greppa föremål med en upprätt hand, med hjälp av vad som kallas "plana grepp". Forskarna skulle vilja utöka sin algoritm till att även möjliggöra sidogrepp, genom att införa fler parametrar och använda ytterligare träningsdata. Enligt Berscheid, den största utmaningen när man försöker uppnå detta kommer att vara att säkerställa att roboten får grepp i sidled samtidigt som antalet greppförsök den utför konstant under träningsfasen.
"Dessutom, att greppa föremål är ofta en del av en uppgift på hög nivå, t.ex. vi vill placera objektet på en specifik position, ", sa Berscheid. "Hur kan vi placera ett okänt föremål exakt? Jag tror att svaret på denna fråga är mycket viktigt för att tackla både industriella och nya tillämpningar inom tjänsterobotik. I vårt projekt vill vi behålla fokus på verklig robotinlärning, överbryggar klyftan mellan leksaksexempel inom forskning och komplexa tillämpningar i den verkliga världen."
© 2019 Science X Network