• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Hanabi:Facebook AI går vidare till samarbete

    Kredit:CC0 Public Domain

    Kortspelet Hanabi har antagits som en utmaning av Facebooks AI, och det är en ganska utmaning med tanke på att de går in i ett rike där spel inte bara är en fråga om att en motståndare ska slå en annan, men ett "kooperativt" kortspel där ett konkurrerande lag hjälper varandra.

    Jonathan Vanian, Förmögenhet , gick läsarna genom spelet som en introduktion:

    "...:lag med två till fem spelare får slumpmässiga kort i olika färger och nummer som representerar poäng. Målet för lagen är att lägga korten på ett bord, grupperade efter färg, i rätt numerisk ordning. Problemet, dock, är att spelare inte kan se sina egna kort medan deras lagkamrater kan. En spelare kan ge tips till en annan, som att göra en kommentar om en viss färg, som skulle tippa den andra att göra något som att spela eller kasta ett kort. Dilemmat är att spelaren måste härleda vad hans lagkamrats ledtråd betyder."

    Företagsledare har visat en lutning mot Hanabi som en teambuilding-inlärningsupplevelse; det har nu vunnit uppmärksamhet från AI-forskare som funderar på att bygga enastående AI-system.

    "Att komma nära perfekta poäng på ett obskyrt franskt kortspel är fantastiskt och allt utom Facebook har större planer för sin kooperativa AI, " sa Engadget .

    Facebook-forskare, Tom Lerer, citerades i Engadget :"Det vi tittar på är artificiella agenter som kan resonera bättre om samarbetsinteraktioner med människor och chatbots som kan resonera om varför personen de chattar med sa det de gjorde...Chatbots som kan resonera bättre om varför människor säga de saker de gör utan att behöva räkna upp varje detalj av det de efterfrågar är en mycket enkel tillämpning av den här typen av sökteknik."

    Vilka AI-strategier använde forskarna?

    Vanian identifierade en sökteknik som tidigare använts av DeepMind; det lät flera Hanabi -bots utvärdera flera spelalternativ samtidigt som de delar information med varandra. I kombination med förstärkningsinlärning, Facebook-botarna lärde sig hur man spelar Hanabi med varandra.

    Författarna bakom denna undersökning skrev en artikel där de diskuterade deras arbete och artikeln finns på arXiv (publicerad i Artificiell intelligens tidning). "The Hanabi Challenge:A New Frontier for AI Research" är titeln på artikeln, och författare sa att de tog på Hanabi som en "utmaningsdomän med nya problem som uppstår från dess kombination av rent samarbetsspel och ofullkomlig information i en miljö med två till fem spelare."

    Författarna påpekade att det bäst beskrivs som en typ av team Solitaire och att spelets ofullkomliga information kommer från att varje spelare inte kan se sina egna kort (de som de har och kan agera på), var och en har en färg och rang.

    För reproducerbara forskningsresultat, författarna släppte en Hanabi RL-miljö med öppen källkod kallad Hanabi Learning Environment skriven i Python och C++.

    Någon annanstans men relevant för deras mål inom reproducerbar forskning, Jerome Pesenti, vice president AI på Facebook, var med i en ny Q&A med Will Knight in Trådbunden .

    Knight frågade Pesenti om att återskapa banbrytande forskning.

    "Det är något som Facebook AI brinner för, " sade Pesenti. "När människor gör saker som inte är reproducerbara, det skapar många utmaningar. Om du inte kan återskapa det, det är mycket förlorad investering ... Det fina med AI är att det i slutändan är system som drivs av datorer. Så det är en främsta kandidat, som ett delområde av vetenskap, att vara reproducerbar. Vi tror att framtiden för AI kommer att vara något där den är reproducerbar nästan som standard. Vi försöker öppna den största koden vi producerar inom AI, så att andra människor kan bygga ovanpå det."

    Författarna, i deras papper, har ett avsnitt med krysshuvudet "Hanabi:The Benchmark."

    Denna forskningssatsning handlar om att använda Hanabi som ett utmanande benchmarkproblem för AI. Unika egenskaper skiljer den från andra riktmärken. "Det är ett inlärningsproblem med flera agenter, till skillnad från, till exempel, Arcade inlärningsmiljö. Det är också ett ofullkomligt informationsspel, där spelarna har asymmetrisk kunskap om miljötillståndet, vilket gör spelet mer som poker än schack, backgammon, eller gå."

    Andrew Tarantola in Engadget tog upp på denna punkt. Livet i den verkliga världen är inte ett nollsummespel som poker eller Starcraft, han sa, "och vi behöver AI för att arbeta med oss, inte mot oss. "

    Två Engadget läsarens kommentarer visade inte vördnad för vad som har uppnåtts hittills. "Ganska säker på att ha kunskap om hur människor brukar spela ett enda kortspel och allmän kunskap om mänskliga avsikter är två väldigt olika saker, " sa en. En annan sa att "att identifiera handlingsmönster är långt ifrån teorin om sinne... Du kan argumentera om de försöker tillskriva teori om sinne, deras noggrannhet behöver arbeta."

    © 2019 Science X Network




    © Vetenskap https://sv.scienceaq.com