• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • System tränar förarlösa bilar i simulering innan de kör ut på vägen

    Ett simuleringssystem som uppfanns vid MIT för att träna förarlösa bilar skapar en fotorealistisk värld med oändliga styrmöjligheter, hjälper bilarna att lära sig att navigera i en mängd värre tänkbara scenarier innan de åker på riktiga gator. Kredit:Massachusetts Institute of Technology

    Ett simuleringssystem som uppfanns vid MIT för att träna förarlösa bilar skapar en fotorealistisk värld med oändliga styrmöjligheter, hjälper bilarna att lära sig att navigera i en mängd värre tänkbara scenarier innan de åker på riktiga gator.

    Kontrollsystem, eller "kontrollanter, " för autonoma fordon förlitar sig till stor del på verkliga datauppsättningar av körbanor från mänskliga förare. Från dessa data, de lär sig hur man efterliknar säkra styrningskontroller i olika situationer. Men verkliga data från farliga "kantfall, "som att nästan krascha eller tvingas av vägen eller in på andra körfält, är — lyckligtvis — sällsynta.

    Vissa datorprogram, kallas "simuleringsmotorer, "syftar till att efterlikna dessa situationer genom att göra detaljerade virtuella vägar för att hjälpa träna kontrollerna att återhämta sig. Men den inlärda kontrollen från simulering har aldrig visat sig övergå till verkligheten på ett fullskaligt fordon.

    MIT-forskarna tar sig an problemet med sin fotorealistiska simulator, kallad Virtual Image Synthesis and Transformation for Autonomy (VISTA). Den använder bara en liten datauppsättning, fångas av människor som kör på en väg, att syntetisera ett praktiskt taget oändligt antal nya synpunkter från banor som fordonet skulle kunna ta i den verkliga världen. Styrenheten belönas för den sträcka den färdas utan att krascha, så det måste lära sig själv hur man når en destination på ett säkert sätt. Genom att göra så, fordonet lär sig att säkert navigera i alla situationer som det möter, inklusive att återta kontrollen efter att ha svängt mellan körfälten eller återhämtat sig från nästan kraschar.

    I tester, en kontrollant utbildad i VISTA-simulatorn på ett säkert sätt kunde sättas in på en fullskalig förarlös bil och navigera genom tidigare osynliga gator. Genom att placera bilen i terränglägen som efterliknade olika situationer som nästan var olycka, Styrenheten kunde också framgångsrikt återställa bilen till en säker körbana inom några sekunder. Ett papper som beskriver systemet har publicerats i IEEE Robotics and Automation Letters och kommer att presenteras vid den kommande ICRA-konferensen i maj.

    "Det är svårt att samla in data i dessa kantfall som människor inte upplever på vägen, " säger första författaren Alexander Amini, en doktorsexamen student vid datavetenskap och artificiell intelligens Laboratory (CSAIL). "I vår simulering, dock, kontrollsystem kan uppleva dessa situationer, lära sig att återhämta sig från dem, och förbli robust när de används på fordon i den verkliga världen."

    Arbetet gjordes i samarbete med Toyota Research Institute. Med Amini på tidningen är Igor Gilitschenski, en postdoc i CSAIL; Jacob Philips, Julia Moseyko, och Rohan Banerjee, alla studenter i CSAIL och Institutionen för elektroteknik och datavetenskap; Sertac Karaman, en docent i flygteknik och astronautik; och Daniela Rus, chef för CSAIL och Andrew och Erna Viterbi professor i elektroteknik och datavetenskap.

    Datadriven simulering

    Historiskt sett, att bygga simuleringsmotorer för att träna och testa autonoma fordon har till stor del varit en manuell uppgift. Företag och universitet använder ofta team av konstnärer och ingenjörer för att skissa virtuella miljöer, med noggranna vägmarkeringar, banor, och även detaljerade löv på träd. Vissa motorer kan också innehålla fysiken i en bils interaktion med sin miljö, baserad på komplexa matematiska modeller.

    Men eftersom det finns så många olika saker att tänka på i komplexa verkliga miljöer, det är praktiskt taget omöjligt att integrera allt i simulatorn. Av den anledningen, Det finns vanligtvis en oöverensstämmelse mellan vad kontrollerna lär sig i simulering och hur de fungerar i den verkliga världen.

    Istället, MIT-forskarna skapade vad de kallar en "datadriven" simuleringsmotor som syntetiserar, från verkliga data, nya banor som överensstämmer med vägens utseende, samt avståndet och rörelsen för alla objekt i scenen.

    De samlar först in videodata från en människa som kör på några vägar och matar in det i motorn. För varje ram, motorn projicerar varje pixel till en typ av 3D-punktmoln. Sedan, de placerar ett virtuellt fordon i den världen. När fordonet gör ett styrkommando, motorn syntetiserar en ny bana genom punktmolnet, baserat på styrkurvan och fordonets orientering och hastighet.

    Sedan, motorn använder den nya banan för att återge en fotorealistisk scen. Att göra så, den använder ett faltningsneuralt nätverk – som vanligtvis används för bildbehandlingsuppgifter – för att uppskatta en djupkarta, som innehåller information om objektens avstånd från kontrollantens synvinkel. Den kombinerar sedan djupkartan med en teknik som uppskattar kamerans orientering inom en 3D-scen. Allt detta hjälper till att fastställa fordonets plats och relativa avstånd från allt i den virtuella simulatorn.

    Baserat på den informationen, den omorienterar de ursprungliga pixlarna för att återskapa en 3D-representation av världen från fordonets nya synvinkel. Den spårar också pixlarnas rörelse för att fånga bilars och människors rörelse, och andra rörliga föremål, i scenen. "Detta motsvarar att förse fordonet med ett oändligt antal möjliga banor, " säger Rus. "För när vi samlar in fysisk data, vi får data från den specifika banan bilen kommer att följa. Men vi kan modifiera den banan så att den täcker alla möjliga sätt och miljöer att köra på. Det är verkligen kraftfullt."

    Förstärkningsinlärning från grunden

    Traditionellt, Forskare har tränat autonoma fordon genom att antingen följa mänskliga regler för körning eller genom att försöka imitera mänskliga förare. Men forskarna får sin kontrollant att lära sig helt från grunden under ett ramverk "end-to-end", vilket innebär att den endast tar rå sensordata som indata – som visuella observationer av vägen – och, från den datan, förutsäger styrkommandon vid utgångar.

    "Vi säger i princip, "Här är en miljö. Du kan göra vad du vill. Krocka bara inte in i fordon, och stanna innanför körfälten, Säger Amini.

    Detta kräver "förstärkningsinlärning" (RL), en trial-and-error maskininlärningsteknik som ger återkopplingssignaler närhelst bilen gör ett fel. I forskarnas simuleringsmotor, kontrollern börjar med att inte veta något om hur man kör, vad är en körfältsmarkering, eller till och med andra fordon ser ut, så den börjar utföra slumpmässiga styrvinklar. Den får en återkopplingssignal först när den kraschar. Vid det tillfället, den teleporteras till en ny simulerad plats och måste utföra en bättre uppsättning styrvinklar för att undvika att krascha igen. Över 10 till 15 timmars träning, den använder dessa glesa återkopplingssignaler för att lära sig att resa längre och längre sträckor utan att krascha.

    Efter att ha kört 10 framgångsrikt, 000 kilometer i simulering, författarna tillämpar den inlärda kontrollern på sitt fullskaliga autonoma fordon i den verkliga världen. Forskarna säger att detta är första gången en kontrollant som utbildats med hjälp av end-to-end förstärkningsinlärning i simulering framgångsrikt har distribuerats på en fullskalig autonom bil. "Det var överraskande för oss. Inte nog med att kontrollern aldrig har varit på en riktig bil tidigare, men den har heller aldrig ens sett vägarna förut och har inga förkunskaper om hur människor kör, " säger Amini.

    Genom att tvinga kontrollenheten att köra igenom alla typer av körscenarier kunde den återta kontrollen från desorienterande positioner – som att vara halvvägs eller in i ett annat körfält – och styra tillbaka till rätt fil inom några sekunder. "Och andra toppmoderna kontroller misslyckades alla tragiskt med det, eftersom de aldrig sett någon sådan data under träning, "Säger Amini.

    Nästa, forskarna hoppas kunna simulera alla typer av vägförhållanden från en enda körbana, som natt och dag, och soligt och regnigt väder. De hoppas också kunna simulera mer komplexa interaktioner med andra fordon på vägen. "Tänk om andra bilar börjar röra sig och hoppa framför bilen?" Rus säger. "De är komplexa, verkliga interaktioner som vi vill börja testa."


    © Vetenskap https://sv.scienceaq.com