• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Forskare använder videospel för att låsa upp nya nivåer av AI

    Kredit:CC0 Public Domain

    Förväntningarna på artificiell intelligens är mycket verkliga och mycket höga. En analys i Forbes projicerar intäkter från A.I. kommer att skjuta i höjden från 1,62 miljarder USD 2018 till 31,2 miljarder USD 2025. Rapporten inkluderade också en undersökning som visar att 84 procent av företagen tror att de investerar i A.I. kommer att leda till konkurrensfördelar.

    "Det är spännande att se de enorma framgångar och framsteg som gjorts de senaste åren, säger Daniel Jiang, biträdande professor i industriteknik vid University of Pittsburgh Swanson School of Engineering. "För att fortsätta denna trend, vi letar efter att utveckla mer sofistikerade metoder för algoritmer för att lära oss strategier för optimalt beslutsfattande."

    Dr Jiang designar algoritmer som lär sig beslutsstrategier i komplexa och osäkra miljöer. Genom att testa algoritmer i simulerade miljöer, de kan lära sig av sina misstag samtidigt som de upptäcker och förstärker strategier för framgång. För att fullända denna process, Dr Jiang och många forskare inom hans område kräver simuleringar som speglar den verkliga världen.

    "Som industriingenjörer, Vi arbetar vanligtvis med problem med operativt fokus. Till exempel, transport, logistik och leveranskedjor, energisystem och hälsovård är flera viktiga områden, " säger han. "Alla dessa problem är höginsatsoperationer med verkliga konsekvenser. De gör inte de bästa miljöerna för att testa experimentell teknik, speciellt när många av våra algoritmer kan ses som smarta sätt att upprepade "trial and error" över alla möjliga åtgärder."

    En strategi för att förbereda avancerad A.I. att ta sig an verkliga scenarier och komplikationer är att använda historiska data. Till exempel, algoritmer kunde gå igenom decenniers data för att hitta vilka beslut som var effektiva och som ledde till mindre än optimala resultat. Dock, forskare har funnit det svårt att testa algoritmer som är designade för att lära sig adaptiva beteenden med enbart data från det förflutna.

    Dr Jiang förklarar, "Historiska data kan vara ett problem eftersom människors handlingar fixar konsekvenserna och inte erbjuder alternativa möjligheter. Med andra ord, det är svårt för en algoritm att ställa frågan "hur skulle saker och ting vara annorlunda om jag valde dörr B istället för dörr A?" I historiska data, allt vi kan se är konsekvenserna av dörr A."

    Videospel, som ett alternativ, erbjuda rika testmiljöer fulla av komplext beslutsfattande utan farorna med att sätta en omogen A.I. fullt ansvarig. Till skillnad från den verkliga världen, de ger ett säkert sätt för en algoritm att lära av sina misstag.

    "Videospelsdesigners bygger inte spel med målet att testa modeller eller simuleringar, " Dr. Jiang säger. "De designar ofta spel med ett dubbelt uppdrag:att skapa miljöer som efterliknar den verkliga världen och att utmana spelare att fatta svåra beslut. Dessa mål råkar vara i linje med vad vi letar efter också. Också, spel är mycket snabbare. På några timmar i realtid, vi kan utvärdera resultaten av hundratusentals spelbeslut."

    För att testa hans algoritm, Dr. Jiang använde en genre av videospel som heter Multiplayer Online Battle Arena eller MOBA. Spel som League of Legends eller Heroes of the Storm är populära MOBAs där spelare kontrollerar en av flera "hjälte"-karaktärer och försöker förstöra motståndarnas baser samtidigt som de skyddar sina egna.

    En framgångsrik algoritm för att träna en A.I. måste övervinna flera utmaningar, såsom beslutsfattande i realtid och långa beslutshorisonter – en matematisk term för när konsekvenserna av vissa beslut inte är kända förrän långt senare.

    "Vi designade algoritmen för att utvärdera 41 bitar av information och sedan mata ut en av 22 olika åtgärder, inklusive rörelse, attacker och speciella rörelser, " säger Dr Jiang. "Vi jämförde olika träningsmetoder mot varandra. Den mest framgångsrika spelaren använde en metod som kallas Monte Carlo -trädsökning för att generera data, som sedan matas in i ett neuralt nätverk."

    Monte Carlo-trädsökning är en strategi för beslutsfattande där spelaren rör sig slumpmässigt genom en simulering eller ett videospel. Algoritmen analyserar sedan spelresultaten för att ge mer tyngd åt mer framgångsrika handlingar. Med tiden och flera iterationer av spelet, ju mer framgångsrika åtgärder kvarstår, och spelaren blir bättre på att vinna spelet.

    "Vår forskning gav också några teoretiska resultat för att visa att Monte Carlo-trädsökning är en effektiv strategi för att utbilda en agent för att lyckas fatta svåra beslut i realtid, även när man verkar i en osäker värld, " förklarar Dr Jiang.

    Dr Jiang publicerade sin forskning i en artikel som skrevs tillsammans med Emmanuel Ekwedike och Han Liu och presenterade resultaten vid 2018 års internationella konferens om maskininlärning i Stockholm, Sverige i somras.

    Vid University of Pittsburgh, han fortsätter att arbeta inom området sekventiellt beslutsfattande med Ph.D. eleverna Yijia Wang och Ibrahim El-Shar. Teamet fokuserar på problem relaterade till delning av resor, energimarknader, och folkhälsa. När industrier förbereder sig för att sätta A.I. ansvarig för kritiska ansvarsområden, Dr Jiang säkerställer att de underliggande algoritmerna håller sig på toppen av deras spel.


    © Vetenskap https://sv.scienceaq.com