• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Modell hjälper robotar att navigera mer som människor gör

    MIT -forskare har tagit fram ett sätt att hjälpa robotar att navigera i miljöer mer som människor gör. Upphovsman:Massachusetts Institute of Technology

    När du rör dig genom en folkmassa för att nå ett slutmål, människor kan vanligtvis navigera i utrymmet säkert utan att tänka för mycket. De kan lära av andras beteende och notera eventuella hinder som ska undvikas. Roboter, å andra sidan, kämpa med sådana navigeringskoncept.

    MIT -forskare har nu tagit fram ett sätt att hjälpa robotar att navigera i miljöer mer som människor gör. Deras nya rörelsesplaneringsmodell låter robotar avgöra hur man når ett mål genom att utforska miljön, observera andra agenter, och utnyttja vad de har lärt sig tidigare i liknande situationer. Ett papper som beskriver modellen presenterades vid veckans IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS).

    Populära rörelsesplaneringsalgoritmer skapar ett träd av möjliga beslut som förgrenar sig tills det hittar bra vägar för navigering. En robot som behöver navigera i ett rum för att nå en dörr, till exempel, kommer att skapa ett steg-för-steg-sökträd med möjliga rörelser och sedan utföra den bästa vägen till dörren, med tanke på olika begränsningar. En nackdel, dock, lär sig dessa algoritmer sällan:Robotar kan inte utnyttja information om hur de eller andra agenter agerade tidigare i liknande miljöer.

    "Precis som när du spelar schack, dessa beslut förgrenar sig tills [robotarna] hittar ett bra sätt att navigera. Men till skillnad från schackspelare, [robotarna] utforska hur framtiden ser ut utan att lära sig mycket om sin miljö och andra agenter, "säger medförfattaren Andrei Barbu, en forskare vid MIT:s datavetenskapliga och artificiella intelligenslaboratorium (CSAIL) och Center for Brains, Sinnen, och maskiner (CBMM) inom MIT:s McGovern Institute. "Tredje gången de går igenom samma folkmassa är lika komplicerat som första gången. De utforskar alltid, observerar sällan, och aldrig använda det som hänt tidigare. "

    Forskarna utvecklade en modell som kombinerar en planeringsalgoritm med ett neuralt nätverk som lär sig känna igen vägar som kan leda till det bästa resultatet, och använder den kunskapen för att styra robotens rörelse i en miljö.

    I deras papper, "Djupa sekventiella modeller för provtagningsbaserad planering, "forskarna visar fördelarna med sin modell i två inställningar:att navigera genom utmanande rum med fällor och smala passager, och navigera i områden samtidigt som man undviker kollisioner med andra agenter. En lovande verklig applikation hjälper autonoma bilar att navigera i korsningar, där de snabbt måste utvärdera vad andra kommer att göra innan de går in i trafiken. Forskarna arbetar för närvarande med sådana ansökningar genom det gemensamma forskningscentret Toyota-CSAIL.

    "När människor interagerar med världen, vi ser ett objekt vi har interagerat med tidigare, eller befinner oss på någon plats vi har varit på tidigare, så vi vet hur vi ska agera, "säger Yen-Ling Kuo, en doktorsexamen i CSAIL och första författare på tidningen. "Tanken bakom detta arbete är att i sökutrymmet lägga till en maskininlärningsmodell som av tidigare erfarenhet vet hur man kan effektivisera planeringen."

    Boris Katz, en huvudforskare och chef för InfoLab Group på CSAIL, är också medförfattare på tidningen.

    Avvärja prospektering och exploatering

    Traditionella rörelseplanerare utforskar en miljö genom att snabbt expandera ett träd av beslut som så småningom täcker ett helt utrymme. Roboten tittar sedan på trädet för att hitta ett sätt att nå målet, som en dörr. Forskarnas modell, dock, erbjuder "en avvägning mellan att utforska världen och utnyttja tidigare kunskaper, "Säger Kuo.

    Inlärningsprocessen börjar med några exempel. En robot som använder modellen är utbildad på några sätt att navigera i liknande miljöer. Det neurala nätverket lär sig vad som gör att dessa exempel lyckas genom att tolka miljön runt roboten, som väggarnas form, andra agenters agerande, och drag i målen. Kortfattat, modellen "lär sig att när du fastnar i en miljö, och du ser en dörröppning, det är nog en bra idé att gå in genom dörren för att komma ut, Säger Barbu.

    Modellen kombinerar utforskningsbeteendet från tidigare metoder med denna inlärda information. Den underliggande planeraren, kallas RRT*, utvecklades av MIT -professorerna Sertac Karaman och Emilio Frazzoli. (Det är en variant av en allmänt använd rörelsesplaneringsalgoritm som kallas Rapidly-exploring Random Trees, eller RRT.) Planeraren skapar ett sökträd medan det neurala nätverket speglar varje steg och gör probabilistiska förutsägelser om var roboten ska gå nästa. När nätverket gör en förutsägelse med stort förtroende, baserat på inlärd information, den guidar roboten på en ny väg. Om nätverket inte har högt förtroende, det låter roboten utforska miljön istället, som en traditionell planerare.

    Till exempel, forskarna demonstrerade modellen i en simulering som kallas en "buggfälla, "där en 2-D-robot måste fly från en inre kammare genom en central smal kanal och nå en plats i ett omgivande större rum. Blinda allierade på vardera sidan av kanalen kan fastna i robotar. I denna simulering kan roboten utbildades i några exempel på hur man kan undkomma olika buggfällor. När man står inför en ny fälla, den känner igen särdrag i fällan, flyr, och fortsätter att söka efter sitt mål i det större rummet. Det neurala nätverket hjälper roboten att hitta utgången till fällan, identifiera återvändsgränderna, och ger roboten en känsla av sin omgivning så att den snabbt kan hitta målet.

    Resultat i tidningen är baserade på chansen att en väg hittas efter en tid, total längd på vägen som nådde ett givet mål, och hur konsekventa vägarna var. I båda simuleringarna forskarnas modell plottade snabbare mycket kortare och konsekventa vägar än en traditionell planerare.

    Arbetar med flera agenter

    I ett annat experiment, forskarna utbildade och testade modellen i navigationsmiljöer med flera rörliga agenter, vilket är ett användbart test för autonoma bilar, särskilt navigeringskorsningar och rondeller. I simuleringen, flera agenter kringgår ett hinder. En robotagent måste framgångsrikt navigera runt de andra agenterna, undvik kollisioner, och nå en målplats, som en avfart i en rondell.

    "Situationer som rondeller är svåra, eftersom de kräver resonemang om hur andra kommer att reagera på dina handlingar, hur du kommer att reagera på deras, vad de ska göra härnäst, och så vidare, "Säger Barbu." Så småningom upptäcker du att din första åtgärd var fel, eftersom det senare kommer att leda till en trolig olycka. Det här problemet blir exponentiellt värre ju fler bilar du har att kämpa med. "

    Resultaten indikerar att forskarnas modell kan fånga tillräckligt med information om de andra agenternas (bilarnas) framtida beteende för att avbryta processen tidigt, samtidigt som du fattar bra beslut inom navigering. Detta gör planeringen mer effektiv. Dessutom, de behövde bara träna modellen på några exempel på rondeller med bara några bilar. "Planerna som robotarna gör tar hänsyn till vad de andra bilarna ska göra, som vilken människa som helst skulle Säger Barbu.

    Att gå genom korsningar eller rondeller är ett av de mest utmanande scenarier som autonoma bilar står inför. Detta arbete kan en dag låta bilar lära sig hur människor beter sig och hur man anpassar sig till förare i olika miljöer, enligt forskarna. Detta är fokus för Toyota-CSAIL Joint Research Center-arbetet.

    "Alla beter sig inte på samma sätt, men människor är väldigt stereotypa. Det finns människor som är blyga, människor som är aggressiva. Modellen känner igen det snabbt och det är därför den kan planera effektivt, Säger Barbu.

    På senare tid, forskarna har tillämpat detta arbete på robotar med manipulatorer som står inför lika skrämmande utmaningar när de når objekt i ständigt föränderliga miljöer.

    Denna artikel publiceras på nytt med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som täcker nyheter om MIT -forskning, innovation och undervisning.




    © Vetenskap https://sv.scienceaq.com