• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • DeepCube-lösarmetoden kan gå utöver kuben i annan forskning

    En illustration av DeepCube. Utbildnings- och lösningsprocessen är uppdelad i ADI och MCTS. Först, vi tränar iterativt en DNN genom att uppskatta det verkliga värdet av ingångstillstånden med hjälp av bredd-först-sökning. Sedan, använder DNN för att styra prospektering, vi löser kuber med Monte Carlo Tree Search. Kredit:arXiv:1805.07470 [cs.AI]

    Släpp lös sätt för en maskin att lösa Rubiks kub? Många lag kan ställa upp och säga varit där, gjort det. Vi har sett många rubriker, för, på hur de klockade in för att sätta tidsrekord. Så vad är det som handlar om den senaste historien om maskinlösning-kub?

    David Grossman in Populär mekanik noterade att Kaliforniens forskare tog saker till den tredje dimensionen med en algoritm som kan räkna ut hur man löser en Rubiks kub.

    Ett team från University of California Irvine står bakom ett tillvägagångssätt som väckte särskild uppmärksamhet. "Lösa Rubiks kub utan mänsklig kunskap" är titeln på deras uppsats, som beskriver deras utforskning, och papperet finns på arXiv.

    Stephen McAleer, Forest Agostinelli, Alexander Shmakov och Pierre Baldi är författarna.

    "Vi introducerar Autodidactic Iteration:en ny algoritm för förstärkningslärande som kan lära sig hur man löser Rubiks kub utan mänskligt stöd."

    Paul Lilly in HotHardware :Maskiner använder vanligtvis en självlärande metod baserad på ett belöningssystem. Forskare matar maskinen spelreglerna, och sedan använder den en belöningsprocess för att avgöra om ett drag var bra eller dåligt,

    Dock, som författarna skrev, "för många kombinatoriska optimeringsmiljöer, belöningarna är sparsamma och episoder är inte garanterade att avslutas."

    De tog Autodidactic Iteration -vägen. De sa, "För att lösa Rubiks kub med hjälp av förstärkningsinlärning, algoritmen kommer att lära sig en policy. Policyn avgör vilket drag som ska tas i ett givet tillstånd. "

    MIT Technology Review fastnade hur det fungerar. "Med tanke på en olös kub, maskinen måste avgöra om ett specifikt drag är en förbättring av den befintliga konfigurationen. Att göra detta, den måste kunna utvärdera flytten. Autodidaktisk iteration gör detta genom att börja med den färdiga kuben och arbeta bakåt för att hitta en konfiguration som liknar det föreslagna draget."

    Författarna skrev att "DeepCube upptäckte en anmärkningsvärd mängd Rubiks Cube-kunskap under sin träningsprocess, inklusive kunskap om hur man använder komplexa permutationsgrupper och strategier som liknar de bästa mänskliga "speed-cubers". "

    Deras träningsmaskin var en 32-kärnig Intel Xeon E5-2620-server med tre NVIDIA Titan XP-GPU:er. De kallade sin lösare DeepCube.

    Lillys bedömning:Det är inte en perfekt lösning på problemet, men är felfri när det gäller noggrannhet.

    Teamet konstaterade i tidningens abstrakt att "Vår algoritm kan lösa 100% av slumpmässigt förvrängda kuber samtidigt som den uppnår en medianlösning på 30 drag - utan eller lika med lösare som använder kunskap om mänsklig domän."

    Varför detta är viktigt:det är en kublösande berättelse och mer. Laget nämnde ytterligare mål.

    "Förutom vidare arbete med Rubiks kub, vi arbetar med att utöka denna metod för att hitta ungefärliga lösningar på andra kombinatoriska optimeringsproblem, såsom förutsägelse av protein tertiär struktur. Många kombinatoriska optimeringsproblem kan ses som sekventiella beslutsfattande problem, i så fall kan vi använda förstärkningsinlärning."

    MIT Technology Review sade den nya metoden tacklade "ett viktigt problem inom datavetenskap - hur man löser komplexa problem när hjälpen är minimal."

    Helst sa Lilly, "Det kan leda till att man hittar botemedel mot sjukdomar, om metoden kan fungera lika bra på sådana saker som den gör med att lösa en Rubiks kub. "

    MIT Technology Review :"Det riktiga testet, självklart, kommer att vara hur detta tillvägagångssätt hanterar mer komplexa problem som proteinveckning. Vi kommer att titta för att se hur det går."

    © 2018 Tech Xplore




    © Vetenskap https://sv.scienceaq.com