• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Använda artificiell intelligens för att berika digitala kartor

    En AI -modell utvecklad vid MIT och Qatar Computing Research Institute som endast använder satellitbilder för att automatiskt märka vägfunktioner i digitala kartor kan förbättra GPS -navigering, särskilt i länder med begränsade kartdata. Kredit:Google Maps/MIT News

    En modell som uppfanns av forskare vid MIT och Qatar Computing Research Institute (QCRI) som använder satellitbilder för att märka vägfunktioner i digitala kartor kan hjälpa till att förbättra GPS -navigering.

    Att visa förare mer information om sina rutter kan ofta hjälpa dem att navigera på okända platser. Bana räknas, till exempel, kan aktivera ett GPS -system för att varna förare för avvikande eller sammanslagna körfält. Att införa information om parkeringsplatser kan hjälpa förare att planera i förväg, medan kartläggning av cykelbanor kan hjälpa cyklister att förhandla fram livliga stadsgator. Att tillhandahålla uppdaterad information om vägförhållanden kan också förbättra planeringen för katastrofhjälp.

    Men att skapa detaljerade kartor är dyrt, tidskrävande process som mestadels utförs av stora företag, som Google, som skickar runt fordon med kameror fastspända på huven för att fånga video och bilder av ett områdes vägar. Att kombinera det med andra data kan skapa korrekta, uppdaterade kartor. Eftersom denna process är dyr, dock, vissa delar av världen ignoreras.

    En lösning är att släppa loss maskininlärningsmodeller på satellitbilder-som är lättare att få tag på och uppdateras ganska regelbundet-för att automatiskt märka vägfunktioner. Men vägar kan blockeras av, säga, träd och byggnader, gör det till en utmanande uppgift. I ett papper som presenterades vid konferensen Association for the Advancement of Artificial Intelligence, MIT- och QCRI -forskarna beskriver "RoadTagger, "som använder en kombination av neurala nätverksarkitekturer för att automatiskt förutsäga antalet körfält och vägtyper (bostäder eller motorvägar) bakom hinder.

    Vid testning av RoadTagger på tilltäppta vägar från digitala kartor över 20 amerikanska städer, modellen räknade körfält med 77 procent noggrannhet och härledda vägtyper med 93 procent noggrannhet. Forskarna planerar också att göra det möjligt för RoadTagger att förutsäga andra funktioner, som parkeringsplatser och cykelbanor.

    "De mest uppdaterade digitala kartorna är från platser som stora företag bryr sig mest om. Om du är på platser bryr de sig inte så mycket om, du har en nackdel med avseende på kartans kvalitet, "säger medförfattaren Sam Madden, en professor vid Institutionen för elektroteknik och datavetenskap (EECS) och en forskare vid laboratoriet för datavetenskap och artificiell intelligens (CSAIL). "Vårt mål är att automatisera processen att generera högkvalitativa digitala kartor, så att de kan vara tillgängliga i vilket land som helst. "

    Tidningens medförfattare är CSAIL-doktorander Songtao He, Favyen Bastani, och Edward Park; EECS grundstudent Satvat Jagwani; CSAIL -professorerna Mohammad Alizadeh och Hari Balakrishnan; och QCRI -forskare Sanjay Chawla, Sofiane Abbar, och Mohammad Amin Sadeghi.

    Kombinerar CNN och GNN

    Quatar, där QCRI är baserat, är "inte en prioritet för de stora företagen som bygger digitala kartor, "Säger Madden. Ändå, det bygger ständigt nya vägar och förbättrar gamla, speciellt som förberedelse inför värdet för fotbolls -VM 2022.

    "När du besöker Qatar, vi har haft erfarenheter där vår Uber -förare inte kan komma på hur han ska ta sig dit han ska, eftersom kartan är så avstängd, "Säger Madden." Om navigationsappar inte har rätt information, för saker som körfältssammanslagning, det kan vara frustrerande eller värre. "

    RoadTagger bygger på en ny kombination av ett konvolutionellt neuralt nätverk (CNN)-som vanligtvis används för bildbehandlingsuppgifter-och ett grafiskt neuralt nätverk (GNN). GNN:s modellförhållanden mellan anslutna noder i en graf och har blivit populära för att analysera saker som sociala nätverk och molekylär dynamik. Modellen är "end-to-end, "vilket betyder att den matas endast rådata och automatiskt producerar utdata, utan mänskligt ingripande.

    CNN tar som råa satellitbilder av målvägar. GNN delar vägen i ungefär 20 meters segment, eller "brickor". Varje kakel är en separat grafnod, anslutna med linjer längs vägen. För varje nod, CNN extraherar vägfunktioner och delar den informationen med sina närmaste grannar. Väginformation sprider sig längs hela grafen, med varje nod som får viss information om vägattribut i varannan nod. Om en viss kakel är blockerad i en bild, RoadTagger använder information från alla brickor längs vägen för att förutsäga vad som ligger bakom tilltäppningen.

    Denna kombinerade arkitektur representerar en mer människoliknande intuition, säger forskarna. Säg att en del av en fyrfilig väg är instängd av träd, så vissa brickor visar bara två banor. Människor kan lätt ana att ett par banor är gömda bakom träden. Traditionella maskininlärningsmodeller-säg, bara ett CNN-extraktfunktioner endast för enskilda brickor och förmodligen förutspår att det blockerade brickan är en tvåfilig väg.

    "Människor kan använda information från intilliggande brickor för att gissa antalet körfält i de tilltäppta brickorna, men nätverk kan inte göra det, "Säger han." Vår metod försöker efterlikna människors naturliga beteende, där vi fångar lokal information från CNN och global information från GNN för att göra bättre förutsägelser. "

    Inlärningsvikter

    För att träna och testa RoadTagger, forskarna använde en verklig kartdatauppsättning, kallas OpenStreetMap, som låter användare redigera och kurera digitala kartor runt om i världen. Från den datauppsättningen, de samlade bekräftade vägattribut från 688 kvadratkilometer kartor över 20 amerikanska städer - inklusive Boston, Chicago, Washington, och Seattle. Sedan, de samlade motsvarande satellitbilder från en Google Maps -dataset.

    I träning, RoadTagger lär sig vikter - som tilldelar funktioner och nodanslutningar varierande grader av CNN och GNN. CNN extraherar funktioner från pixelmönster av brickor och GNN sprider de inlärda funktionerna längs grafen. Från slumpmässigt utvalda undergrafer av vägen, systemet lär sig att förutsäga vägfunktionerna vid varje bricka. Genom att göra så, det lär sig automatiskt vilka bildfunktioner som är användbara och hur man sprider dessa funktioner längs grafen. Till exempel, om en målbricka har oklara filmarkeringar, men grannplattan har fyra körfält med tydliga filmarkeringar och delar samma vägbredd, då kommer målbrickan sannolikt också att ha fyra banor. I detta fall, modellen lär sig automatiskt att vägbredden är en användbar bildfunktion, så om två intilliggande brickor delar samma vägbredd, de har troligen samma körfält.

    Med tanke på en väg som inte syns i träning från OpenStreetMap, modellen bryter vägen till brickor och använder sina inlärda vikter för att göra förutsägelser. Uppdraget med att förutsäga ett antal körfält i en tilltäppt kakel, modellen noterar att angränsande plattor har matchande pixelmönster och, därför, stor sannolikhet att dela information. Så, om dessa brickor har fyra banor, den ockluderade brickan måste också ha fyra.

    I ett annat resultat, RoadTagger förutspådde körfältens nummer exakt i en datamängd med syntetiserade, mycket utmanande vägstörningar. Som ett exempel, en överfart med två körfält täckte några brickor av en målväg med fyra körfält. Modellen upptäckte felaktiga pixelmönster för övergången, så den ignorerade de två banorna över de täckta brickorna, exakt förutspår fyra banor var under.

    Forskarna hoppas kunna använda RoadTagger för att hjälpa människor att snabbt validera och godkänna kontinuerliga ändringar av infrastrukturen i datamängder som OpenStreetMap, där många kartor inte innehåller körfält eller andra detaljer. Ett särskilt intresseområde är Thailand, Bastani säger, där vägarna ständigt förändras, men det finns få om några uppdateringar i datamängden.

    "Vägar som en gång var märkta som grusvägar har varit asfalterade så det är bättre att köra på, och några korsningar har byggts helt över. Det sker förändringar varje år, men digitala kartor är inaktuella, " he says. "We want to constantly update such road attributes based on the most recent imagery."

    Denna artikel publiceras på nytt med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som täcker nyheter om MIT -forskning, innovation och undervisning.




    © Vetenskap https://sv.scienceaq.com