• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • En robothand kan jonglera med en kub – med mycket träning

    Detta odaterade foto från OpenAI visar en robothand som håller en kub i företagets forskningslabb i San Francisco. Handen, kallas Dactyl, har ett enda jobb, och det är att rotera en kub tills bokstaven uppåt matchar ett slumpmässigt urval. (Eric Louis Haines/OpenAI via AP)

    Hur lång tid tar det för en robothand att lära sig att jonglera med en kub?

    Cirka 100 år, ge eller ta.

    Så mycket virtuell datortid det tog forskare vid OpenAI, det ideella labbet för artificiell intelligens finansierat av Elon Musk och andra, att träna sin kroppslösa hand. Teamet betalade Google $3, 500 för att köra sin programvara på tusentals datorer samtidigt, knasande den faktiska tiden till 48 timmar. Efter att ha tränat roboten i en virtuell miljö, teamet testade det i den verkliga världen.

    Handen, kallas Dactyl, lärt sig att röra sig, teamet på två dussin forskare avslöjade denna vecka. Dess uppgift är helt enkelt att justera kuben så att en av bokstäverna - "O, "''P, "''E, "''N, "''A" eller "I''—vänder uppåt för att matcha ett slumpmässigt urval.

    Ken Goldberg, ett University of California, Berkeley robotikprofessor som inte är ansluten till projektet, sade OpenAI:s prestation är en stor sak eftersom det visar hur robotar som tränas i en virtuell miljö kan fungera i den verkliga världen. Hans labb försöker något liknande med en robot som heter Dex-Net, även om dess hand är enklare och föremålen den manipulerar är mer komplexa.

    Det här odaterade fotot från OpenAI visar en robothand som roterar en kub vid företagets forskningslabb i San Francisco. Handen, kallas Dactyl, har ett enda jobb, och det är att rotera en kub tills bokstaven uppåt matchar ett slumpmässigt urval. (Eric Louis Haines/OpenAI via AP)

    "Nyckeln är idén att du kan göra så mycket framsteg i simulering, " sa han. "Detta är en rimlig väg framåt, när man gör fysiska experiment är det väldigt svårt."

    Dactyls verkliga fingrar spåras av infraröda punkter och kameror. I träning, varje simulerad rörelse som förde kuben närmare målet gav Dactyl en liten belöning. Att tappa kuben fick den att känna ett straff 20 gånger så stort.

    Processen kallas för förstärkningsinlärning. Robotmjukvaran upprepar försöken miljontals gånger i en simulerad miljö, försöker om och om igen för att få den högsta belöningen. OpenAI använde ungefär samma algoritm som den använde för att slå mänskliga spelare i ett videospel, "Dota 2."

    I verkligheten, ett team av forskare arbetade ungefär ett år för att få den mekaniska handen till denna punkt.

    Varför?

    I denna torsdag, 26 juli, 2018, Foto, OpenAI-forskaren Jonas Schneider undersöker forskningslabbets robothand i San Francisco. Handen, kallas Dactyl, har ett enda jobb, och det är att rotera en kub tills bokstaven uppåt matchar ett slumpmässigt urval. (AP Photo/Ryan Nakashima)

    För en, handen i en simulerad miljö förstår inte friktion. Så även om dess riktiga fingrar är gummiaktiga, Dactyl saknar mänsklig förståelse för de bästa greppen.

    Forskare injicerade sin simulerade miljö med förändringar i gravitationen, handvinkel och andra variabler så att programvaran lär sig att fungera på ett sätt som är anpassningsbart. Det hjälpte till att minska klyftan mellan verkliga resultat och simulerade resultat, som var mycket bättre.

    Variationerna hjälpte handen att lyckas sätta rätt bokstav uppåt mer än ett dussin gånger i rad innan den tappade kuben. I simulering, handen lyckades vanligtvis 50 gånger i rad innan testet stoppades.

    OpenAI:s mål är att utveckla artificiell allmän intelligens, eller maskiner som tänker och lär som människor, på ett sätt som är säkert för människor och sprids.

    Musk har varnat för att om AI-system endast utvecklas av vinstdrivande företag eller mäktiga regeringar, de skulle en dag kunna överträffa mänskliga smarta och vara farligare än kärnvapenkrig med Nordkorea.

    © 2018 The Associated Press. Alla rättigheter förbehållna.




    © Vetenskap https://sv.scienceaq.com