Översikt över PoseRBPF-ramverket för 6D-objekt posespårning. Metoden utnyttjar ett Rao-Blackwellized partikelfilter och ett auto-encoder-nätverk för att uppskatta 3D-translationen och en fullständig distribution av 3D-rotationen av ett målobjekt från en videosekvens. Kredit:University of Illinois i Urbana-Champaign
Robotar är bra på att göra identiska repetitiva rörelser, som en enkel uppgift på löpande band. (Ta upp en kopp. Vänd på den. Lägg ner den.) Men de saknar förmågan att uppfatta föremål när de rör sig genom en miljö. (En människa tar upp en kopp, lägger ner den på en slumpmässig plats, och roboten måste hämta den.) En nyligen genomförd studie utfördes av forskare vid University of Illinois i Urbana-Champaign, NVIDIA, University of Washington, och Stanford University, på 6D-objektpositionsuppskattning för att utveckla ett filter för att ge robotar större rumsuppfattning så att de kan manipulera objekt och navigera genom rymden mer exakt.
Medan 3-D pose ger platsinformation på X, Y, och Z-axlar – relativ placering av objektet i förhållande till kameran – 6D-position ger en mycket mer komplett bild. "Mycket som att beskriva ett flygplan under flygning, roboten behöver också känna till de tre dimensionerna av objektets orientering – dess gir, tonhöjd, och rulla, " sa Xinke Deng, doktorand studerar med Timothy Bretl, en docent vid avdelningen för flygteknik vid U of I.
Och i verkliga miljöer, alla sex av dessa dimensioner förändras ständigt.
"Vi vill att en robot ska fortsätta följa ett objekt när det rör sig från en plats till en annan, " sa Deng.
Deng förklarade att arbetet gjordes för att förbättra datorseendet. Han och hans kollegor utvecklade ett filter för att hjälpa robotar att analysera rumslig data. Filtret tittar på varje partikel, eller en bit av bildinformation som samlats in av kameror riktade mot ett objekt för att minska bedömningsfel.
"I ett bildbaserat ramverk för uppskattning av 6D-ställningar, ett partikelfilter använder många prover för att uppskatta position och orientering, Deng sa. "Varje partikel är som en hypotes, en gissning om position och inriktning som vi vill uppskatta. Partikelfiltret använder observation för att beräkna värdet av betydelsen av informationen från de andra partiklarna. Filtret eliminerar felaktiga uppskattningar.
"Vårt program kan uppskatta inte bara en enskild pose utan också osäkerhetsfördelningen av ett objekts orientering, " sade Deng. "Tidigare, det har inte funnits ett system för att uppskatta den fullständiga fördelningen av objektets orientering. Detta ger viktig osäkerhetsinformation för robotmanipulation."
Översikt över PoseRBPF-ramverket för 6D-objekt posespårning. Metoden utnyttjar ett Rao-Blackwellized partikelfilter och ett auto-encoder-nätverk för att uppskatta 3D-translationen och en fullständig distribution av 3D-rotationen av ett målobjekt från en videosekvens. Kredit:University of Illinois Department of Aeropsace Engineering
Studien använder 6D-objekt posespårning i Rao-Blackwellized partikelfiltreringsramverket, där 3D-rotationen och 3D-translationen av ett objekt separeras. Detta möjliggör forskarnas tillvägagångssätt, kallas PoseRBPF, för att effektivt uppskatta 3D-translationen av ett objekt tillsammans med den fulla fördelningen över 3D-rotationen. Som ett resultat, PoseRBPF kan spåra objekt med godtyckliga symmetrier samtidigt som adekvata bakre distributioner bibehålls.
"Vårt tillvägagångssätt uppnår toppmoderna resultat på två 6D-positionsuppskattningar, " sa Deng.
Studien, "PoseRBPF:Ett Rao-Blackwellized partikelfilter för 6D objektpositionsuppskattning, " presenterades vid Robotics Science and Systems Conference i Freiburg, Tyskland. Den är skriven av Xinke Deng, Arsala Mousavian, Yu Xiang, Fei Xia, Timothy Bretl, och Dieter Fox.