Exempel från datasetet som forskarna arbetade med. Kredit:Wang et al.
Människor har den medfödda förmågan att förutsäga effekten av kollisioner, bara använda sitt sunda förnuft. I många fall, människor kan till och med förutsäga resultatet av liknande kollisioner i situationer där massa, friktion, eller andra faktorer varierar. Kan maskiner också uppnå en liknande förmåga?
Forskare vid Carnegie Mellon Universitys Robotics Institute och vid Third Wave Automation har nyligen skapat en tolkningsbar intuitiv fysikmodell för att förutsäga effekterna av kollisioner. Deras maskininlärningsbaserade modell, presenteras i en tidning förpublicerad på arXiv, visade sig generalisera väl, även i situationer där liknande scener simuleras med olika underliggande egenskaper.
"När en kollision inträffar, vi människor kan sluta oss till den underliggande fysiken och använda denna information för att förutsäga effekten av kollisionen, "Xiaolong Wang, en av forskarna som genomförde studien, berättade för TechXplore. "Till exempel, vi kan förutsäga att en sfär kommer att studsa tillbaka när den kolliderar med en tyngre låda, medan sfären fortsätter att röra sig om den kolliderar med ett lättare föremål. Inspirerad av detta, vi designade en intuitiv fysikmodell som kan förstå de fysiska egenskaperna (friktion, massa och hastighet) av objekten genom att titta på videor av objektkollisioner, hjälper till att bättre förutsäga resultatet av kollisioner."
I den intuitiva fysikmodellen utvecklad av Wang och hans kollegor, specifika dimensioner i flaskhalsskikten i det konvolutionella neurala nätverket (CNN) motsvarar olika fysiska egenskaper. Eftersom dessa egenskaper ofta är beroende av varandra eller är kopplade, forskarna introducerade också en utbildningsplan och en generaliserad förlustfunktion, som visade sig överträffa baslinjemetoderna.
Resultat producerade av modellen. Kredit:Wang et al.
"Vår modell är ett konvolutionellt neuralt nätverk av kodare-avkodarestruktur, " Wang förklarade. "Ingångarna för modellen är videobilderna innan kollisionen inträffar och ögonblicket för kollisionen. Modellen kommer att generera de lösryckta representationerna av massan, friktion och hastighet hos föremålen. Dessa fysiska representationer avkodas sedan för att förutsäga den framtida bilden efter kollisioner."
I utvärderingar som gjorts av forskarna, modellen visade sig generalisera väl över scener med olika underliggande fysiska egenskaper eller där objekt hade olika former. Dessutom, den kunde effektivt förutsäga framtiden i fall där den fysiska miljön förändrades.
"Att lära oss en tolkningsbar fysikmodell gör att vi kan få en bättre förståelse av neurala nätverk, " sa Wang. "Istället för att titta på ett svart lådans neurala nätverk, vi kan nu manipulera och kontrollera nätverksrepresentationerna för att generera de prediktionsresultat vi vill ha."
Studien utförd av Wang och hans kollegor ger en glimt av hur långt neurala nätverk kan gå för att replikera medfödda mänskliga förmågor. I framtiden, deras modell kan ha ett antal intressanta tillämpningar inom verkliga scenarier, förutsäga resultatet av kollisioner mellan verkliga objekt i rymden.
"Vårt arbete är baserat på simuleringar, så vi försöker nu anpassa vår metod till den verkliga världen, " sa Wang. "Genom att gå in i den fysiska världen, vi tillåter också människor eller robotar att aktivt interagera med objekten för att förstå fysiken."
© 2018 Tech Xplore