En robot behöver lära sig om sin kropp och miljön. Den provar några olika rörelser och använder algoritmen. Den kan då förutsäga vad som kommer att hända med större rörelser och i högre hastigheter. Upphovsman:IST Austria/Birgit Rieger
Att förstå hur en robot kommer att reagera under olika förhållanden är avgörande för att garantera en säker drift. Men hur vet du vad som kommer att krossa en robot utan att faktiskt skada den? En ny metod utvecklad av forskare vid Institute of Science and Technology Österrike (IST Österrike) och Max Planck Institute for Intelligent Systems (MPI for Intelligent Systems) är den första maskininlärningsmetoden som kan använda observationer gjorda under säkra förhållanden för att göra exakta förutsägelser för alla möjliga förhållanden som styrs av samma fysiska dynamik. Speciellt utformad för verkliga situationer, deras metod ger enkel, tolkbara beskrivningar av den bakomliggande fysiken. Forskarna kommer att presentera sina resultat i morgon vid årets prestigefyllda International Conference for Machine Learning (ICML).
Förr, maskininlärning kunde bara interpolera data – göra förutsägelser om situationer som är "mellan" andra, kända situationer. Den var oförmögen att extrapolera – göra förutsägelser om situationer utanför det kända – eftersom den lär sig att passa de kända data så nära som möjligt lokalt, oavsett hur det fungerar utanför dessa situationer. Dessutom, att samla in tillräckligt med data för effektiv interpolering är både tids- och resurskrävande, och kräver data från extrema eller farliga situationer. Men nu, Georg Martius, tidigare ISTFELLOW och IST Österrike postdoc, och sedan 2017 gruppledare på MPI for Intelligent Systems i Tübingen, Subham S. Sahoo, en Ph.D. student även på MPI for Intelligent Systems, och Christoph Lampert, professor vid IST Österrike, utvecklat en ny maskininlärningsmetod som tar itu med dessa problem, och är den första maskininlärningsmetoden för att exakt extrapolera till osynliga situationer.
Nyckelfunktionen hos den nya metoden är att den strävar efter att avslöja den sanna dynamiken i situationen:den tar in data och returnerar ekvationerna som beskriver den underliggande fysiken. "Om du känner till dessa ekvationer, säger Georg Martius, "då kan du säga vad som kommer att hända i alla situationer, även om du inte har sett dem." Med andra ord, detta är vad som gör att metoden kan extrapolera tillförlitligt, vilket gör det unikt bland maskininlärningsmetoder.
Teamets metod skiljer sig även på flera andra sätt. Först, de slutliga approximationerna som tidigare producerats under maskininlärning var alldeles för komplexa för en människa att förstå eller arbeta med. I den nya metoden, de resulterande ekvationerna är mycket enklare:"Vår metods ekvationer är något du skulle se i en lärobok - enkla och intuitiva, ", säger Christoph Lampert. Det senare är en annan viktig skillnad:andra metoder för maskininlärning ger ingen insikt i förhållandet mellan villkor och resultat - och därmed, ingen intuition om huruvida modellen ens är rimlig. "Inom alla andra forskningsområden, vi förväntar oss modeller som är fysiskt vettiga, som berättar varför, " tillägger Lampert. "Detta är vad vi bör förvänta oss av maskininlärning, och vad vår metod ger." Slutligen, för att garantera tolkningsbarhet och optimera för fysiska situationer, teamet baserade sin inlärningsmetod på en annan typ av ramverk. Denna nya design är enklare än tidigare metoder, vilket i praktiken innebär att mindre data behövs för att ge samma eller ännu bättre resultat.
Och det är inte bara teori:"I min grupp, vi arbetar faktiskt med att utveckla en robot som använder den här typen av lärande. I framtiden, roboten skulle experimentera med olika rörelser, sedan kunna använda maskininlärning för att avslöja ekvationerna som styr dess kropp och rörelse, så att den kan undvika farliga handlingar eller situationer, ", tillägger Martius. Även om robotar är ett aktivt forskningsområde, metoden kan användas med alla typer av data, från biologiska system till röntgenövergångsenergier, och kan även integreras i större maskininlärningsnätverk.