• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Hur poker och andra spel hjälper artificiell intelligens att utvecklas

    Bästa mänskliga mästare i komplexa spel som pjäser, poker and Go är en idealisk utmaning för artificiell intelligens – och en språngbräda till omfattande tillämpningar utanför spelrummet, säger UAlberta-experter. Kredit:University of Alberta

    När han växte upp i Ohio, hans föräldrar var ivriga kortspelare, dela ut allt från euchre till gin rummy. Under tiden, han och hans vänner skulle riva upp brädspel som låg runt familjens hem och kombinerade bitarna för att göra sina egna spel, med nya utmaningar och nya markörer för seger.

    Bowling har kommit långt ifrån hans dagar av att spela med färgglada kort och plasttärningar. Han har tre examina i datavetenskap och är nu professor vid University of Alberta.

    Men, i hans hjärta, Bowling älskar fortfarande att spela spel. Hans forskning inom artificiell intelligens – och hur den korsar spel och maskininlärning – har placerat honom i framkant av det snabbt utvecklande området.

    "Spel är ett så vackert mikrokosmos av intressanta beslutsfattande problem, " han säger.

    "För ett ögonblick), du kan behålla det som en fristående sak, där dina artificiella intelligensagenter tittar på spelets värld och försöker lösa den. På samma sätt, det är roligt för människor att spela det spelet i en minut och förenkla sina världar till det."

    Bowling leder universitetets Computer Poker Research Group, där han och ett team löste ett problem förra året som en gång ansågs vara olösligt:​​gruppen utvecklade en algoritm som slår professionella pokerspelare i no-limit Texas hold 'em poker.

    Det heter DeepStack. Dess framgång anses vara en annan milstolpe inom forskning om artificiell intelligens, där komplexa algoritmer ofta börjar med forskare som använder kortspel, brädspel och videospel som deras testområde.

    Från pjäser till det mänskliga genomet

    1989, dataforskaren Jonathan Schaeffer hade idén att skriva ett datorprogram, Chinook, att vinna världsmästerskapet i dam/draught.

    Medan människor i schackspelargemenskapen blev fascinerade av nyheten med en dator som tävlar i deras turneringar, de blev förvånade när, i bara sin andra turnering, Chinook fick rätten att spela för världsmästerskapet.

    De styrande organen för världscheckare motsatte sig först idén om en dator som skulle spela för världsmästerskapet, men spelets toppförbund gav så småningom efter sig – något – och bildade en ny händelse:Man vs. Machine World Championship.

    1992, Chinook förlorade mot Marion Tinsley, som hade gått i pension föregående år som världsmästare i dam. Men i en revansch 1994, programmet segrade. Chinook blev det första programmet som vann ett mänskligt världsmästerskap i något spel, en bedrift som erkändes av Guinness World Records.

    Den kampen mellan människan mot maskinen har utspelat sig om och om igen under decennierna sedan:1997, IBMs Deep Blue – som var medförfattare av U of A-alumnen Murray Campbell och två andra – slog världsmästaren i schack Garry Kasparov; under 2011, IBMs Watson tog hem en $1 miljon Jeopardy! mästerskap; och förra året, AlphaGo blev det första datorprogrammet som slog en människa i det komplexa brädspelet, Gå.

    Schaeffer, nu dekanus för U of A:s naturvetenskapliga fakultet, har forskat om artificiell intelligens sedan 1979.

    "Jag gör AI-forskning. Och ett av testerna som jag använder, den mest populära bland studenter, råkar vara spel. Och om idéerna är bra, de kan tillämpas på andra applikationer."

    Schaeffer njuter helt klart av det roliga med ett spel, konkurrensen och den breda dragningskraften att arbeta med något som så många kan relatera till. Men han är också tydlig med att spelforskning kan ha effekter långt bortom en kortlek eller en spelbräda.

    Han pekar på något som finns överallt i dagens liv:GPS-systemet. Och han kopplar tekniken bakom den till Rubiks kub.

    "Rubiks kub är blandad. Det är din "start" och du försöker komma till en position där allt är på plats. Vad är vägen att gå från en punkt till en annan? Tänk på varje drag (i spelet) som del av din resa, och du vill ta dig från början till slut så snabbt som möjligt – vilket är precis vad GPS:en gör.

    "Jag skulle vilja tro att några av de idéer vi har genererat här används i GPS-system. Det vet vi inte med säkerhet. Vårt arbete är offentligt och företag behöver inte avslöja vad de stoppar i sina produkter."

    Jonathan Schaeffer utvecklade Chinook, ett schackspelsprogram som besegrade före detta världsmästarinnan Marion Tinsley 1994 – det första programmet som vann ett mänskligt världsmästerskap i något spel. Kredit:Richard Siemens

    Schaeffers arbete med Chinook involverade en enorm mängd datorkraft som var tvungen att organisera data och komprimera den till något väldigt litet. Programmet måste också snabbt hitta information, bland de biljoner datapunkter som komprimerades.

    Strax efter Chinooks världsmästerskap, en biolog kom in på Schaeffers kontor. Han arbetade på det mänskliga genomprojektet, vilket också innebar en enorm mängd data. Han behövde också komprimera denna data, och identifiera element snabbt.

    Ett år senare, ett företag som heter BioTools bildades för att stödja det mänskliga genomprojektet. Några av idéerna som användes i deras produkter kom från damforskningen.

    "Det var en av dessa trevliga överraskningar, helt oväntat, kommer ut från vänster fält."

    Att bygga den "intuitiva" maskinen

    Det senaste arbetet från U of A för att bemästra no-limit Texas hold 'em poker landade i mars 2017-upplagan av den prestigefyllda tidskriften Vetenskap . Det som gjorde bedriften banbrytande är att spelet är ett "imperfekt information"-scenario – till skillnad från schack eller pjäs, där båda spelarna kan se allt på bordet, spelare i poker håller några kort för sig själva.

    Utmaningen för Bowling och hans team var att utveckla en "intuition" för DeepStack.

    "Våra algoritmer måste tänka djupt på vad den andra agenten KAN veta om mina kort just nu och vad kan jag veta om deras kort. Resonemanget måste omfatta övertygelser och inte bara vad du kan se på bordet."

    För att utveckla den där maginstinkten, den där "intuitionen, Bowling och hans team var tvungna att köra DeepStack genom tiotals miljoner pokerscenarier. Programmet började känna igen vissa situationer som bra och vissa som dåliga, vissa som mindre bra eller mindre dåliga.

    Detta byggde upp DeepStacks allmänna erfarenhet, och den började känna igen nya situationer som olika grader av bra eller dåliga – och lät den komma med de bästa pjäserna utifrån det.

    Teamet bevisade DeepStacks kompetens genom att låta det spela mot några av de bästa pokerspelarna i världen. De spelade så många händer att resultaten var statistiskt signifikanta.

    På frågan om DeepStack kommer att döda poker – trots allt, vem vill spela mot en maskin om det är garanterat att maskinen vinner?—Bowlingpoäng till schack.

    "Det sades om schack och nu finns det kanske fler stormästare än någon annan gång... det verkar ha accelererat skicklighetsnivån, " han säger, noterar att amatörer kan spela mot de bästa datorerna för att finslipa sina färdigheter och det finns tävlingar där schackspelare slår sig ihop med datorer för att förbättra konkurrensen.

    Men han erkänner också att poker är lite annorlunda. Folk spelar poker för pengar. Det är en spelverksamhet, och det är ingen mening att spela mot en enhet som är statistiskt sannolikt att vinna.

    "Det kanske betyder att poker börjar handla om något annat än bara en ren spelaktivitet... Jag hoppas att det kanske kommer att flytta spelet bort från spelbiten. Låt oss försöka ta reda på vilka de bästa spelarna i världen är och kanske vi skulle kunna börja markera detta för vad det är, en färdighetsbaserad aktivitet."

    Bowling började först sitt arbete med DeepStack med det tillvägagångssättet att de flesta "verkliga" problem är, faktiskt, ofullkomliga informationsscenarier.

    Men hans arbete drivs inte bara av hur hans AI-genombrott kan tillämpas utanför spelets område.

    "Om vi ​​ska driva framåt för att se mer kapabel artificiell intelligens, det kan vara en distraktion att säga, "Här är en applikation som du kan tjäna mycket pengar på." Är det verkligen vägen för att få oss till bättre, mer kapabel artificiell intelligens?

    "Det borde finnas människor som driver på den långsiktiga vägen, som driver det vidare till nästa sak utan att vara säker på hur det kommer att bli en aktivitet att tjäna pengar."


    © Vetenskap https://sv.scienceaq.com