• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Forskare utforskar naturlig språkbehandling för att bedöma schackrörelser

    Komplett pipeline för utbildning av utvärderingsmodellen. Kredit:arXiv:1907.08321 [cs.LG]

    Schack och AI är i nyheterna igen, denna gång i rapporter om ett lag som utforskar en modell för schack via naturlig språkbehandling (NLP). Inlärningsmekanismen var schackprat – väl valt pladder. De förtränade på kommentarsentiment som var förknippade med schackdrag. Känslorna styrde agentens beslutsfattande.

    Deras resulterande schackalgoritm utformades för att utvärdera kvaliteten på schackdrag genom att analysera reaktionen från expertkommentatorer.

    De tre forskarna från University College London skrev en artikel som beskrev deras metoder och resultat. Isaac Kamlish, Isaac Chocron och Nicholas McCarthy skrev "SentiMATE:Learning to play Chess through Natural Language Processing, " och det finns uppe på arXiv. Uppsatsen skickades in förra månaden.

    "Vi presenterar SentiMATE, en ny end-to-end Deep Learning-modell för schack, använder Natural Language Processing som syftar till att lära sig en effektiv utvärderingsfunktion som bedömer flyttkvalitet. Den här funktionen är förtränad på känslan av kommentarer i samband med träningsrörelserna, och används för att vägleda och optimera agentens beslutsfattande när det gäller spel."

    Bjud inte in AlphaZero och denna NLP-modell till samma fest; de skulle stanna på motsatta sidor av rummet. Forskarna skrev att Deep Minds AlphaZero hade lyckats "efter miljontals iterationer av självspel och användning av tusentals Tensor Processing Units (TPUs)." Så var inte fallet i den nya forskningen.

    Istället, de sa, de syftade till "att ta itu med bedömningen av kvaliteten på individuella rörelser genom användning av Natural Language Processing...Data från olika schackwebbplatser skrapades, som inkluderade information om de flytt som gjordes, och en kvalitativ bedömning av själva rörelserna i form av kommentarer, skriven av ett brett spektrum av schackspelare; resulterar i en stor databas med drag med kommenterade kommentarer."

    "Den utvärderar kvaliteten på schackrörelser genom att analysera reaktionen från expertkommentatorer, sade Will Knight, MIT Technology Review .

    Forskarna beskärade kommentarer som inte gällde rörelser av hög kvalitet och exempel som var alltför tvetydiga, han lade till. "Sedan använde de en speciell typ av återkommande neurala nätverk och ordinbäddningar (en matematisk teknik som kopplar samman ord utifrån deras betydelser), utbildad på en annan toppmodern modell för att analysera språk."

    Algoritmen, kallas SentiMATE, utarbetade själv de grundläggande reglerna för schack samt flera nyckelstrategier – inklusive gaffel och kastning.

    Teamet fann att SentiMATE var kapabel att utvärdera schackdrag "baserat på en förtränad sentimentutvärderingsfunktion." De drog slutsatsen att det fanns starka bevis för att stödja naturlig språkbehandling som används för att träna en utvärderingsfunktion i schackmotorer.

    Prestandan för deras lösning var mindre än spektakulär. Knight sa, "det misslyckades med att slå några konventionella schackrobotar konsekvent." Den där, dock, bör inte distrahera från det faktum att SentiMATE fungerade, och hur det fungerade:

    "SentiMATE överraskade forskarna med sin förmåga att utarbeta några av schackets grundprinciper samt flera nyckelstrategier, såsom forking (när två eller flera pjäser hotas samtidigt) och castling (när kungen och slottet båda flyttar till en mer defensiv position på brädets baksida, " sa författarna.

    Det viktiga är att skapa ett sådant program:kan språket tjäna till att lära ut hur man spelar schack med mindre träningsdata som krävs än i konventionella metoder?

    Tibi Puiu in ZME Science tänkte på det:

    "Bara den här gången, deras maskininlärningsprogram övade inte miljontals spel för att bemästra schack utan analyserade snarare språket hos expertkommentatorer. Någon dag, forskarna säger att ett liknande tillvägagångssätt skulle kunna tillåta maskiner att dechiffrera känslomässigt språk och skaffa sig färdigheter som annars skulle ha varit otillgängliga genom "brute force".

    När det gäller modellen som inte är en superschackmästare, han sa, "Prestanda på hög nivå var inte dess mål, fastän. Där SentiMATE lyser är i dess förmåga att använda språk för att förvärva en färdighet istället för att öva på den."

    I deras tidning, författarna pratade om den viktiga datamängden för att stödja deras forskning. "Vid rengöring och klassificering av datamängden baserat på kommentarer, bitifiera schackdragen, och tillämpa sentimentanalys på kommentaren, vi presenterar SentiChess en datauppsättning på 15, 000 schackdrag representerade i bitformat, tillsammans med deras kommentarer och sentimentutvärdering. Denna datauppsättning erbjuds i hopp om ytterligare utveckling av arbetet kring sentimentbaserade schackmodeller, och statistisk rörelseanalys."

    Går vidare, Will Knight sa att spelrelevant prat kan hjälpa AI-program att lära sig spela spelet på ett nytt sätt. Och, bortom schack, "samma teknik skulle kunna tillåta maskiner att använda det känslomässiga innehållet i vårt språk för att bemästra olika praktiska uppgifter."

    (Som den MIT Technology Review s underrubrik uttryckte det, "Maskiner som uppskattar 'briljanta' och 'dumma' schackdrag kan lära sig att spela spelet – och göra andra saker – mer effektivt.)

    © 2019 Science X Network




    © Vetenskap https://sv.scienceaq.com