Latenta inbäddningar från ett ramverk färgat av fysiska tillståndsvariabler. Kredit:Boyuan Chen/Columbia Engineering
Energi, massa, hastighet. Dessa tre variabler utgör Einsteins ikoniska ekvation E=MC 2 . Men hur visste Einstein om dessa begrepp från första början? Ett första steg för att förstå fysik är att identifiera relevanta variabler. Utan begreppet energi, massa och hastighet skulle inte ens Einstein kunna upptäcka relativitet. Men kan sådana variabler upptäckas automatiskt? Att göra det kan avsevärt påskynda vetenskapliga upptäckter.
Detta är frågan som forskare vid Columbia Engineering ställde till ett nytt AI-program. Programmet utformades för att observera fysiska fenomen genom en videokamera, och sedan försöka söka efter den minimala uppsättningen av fundamentala variabler som fullständigt beskriver den observerade dynamiken. Studien publicerades den 25 juli i Nature Computational Science .
Forskarna började med att mata systemet med rå videofilmer av fenomen som de redan visste svaret på. Till exempel matade de en video av en svängande dubbel pendel känd för att ha exakt fyra "tillståndsvariabler" - vinkeln och vinkelhastigheten för var och en av de två armarna. Efter några timmars analys producerade AI svaret:4.7.
"Vi trodde att det här svaret var tillräckligt nära", säger Hod Lipson, chef för Creative Machines Lab vid avdelningen för maskinteknik, där arbetet i första hand utfördes. "Särskilt eftersom allt AI hade tillgång till var obearbetade videofilmer, utan någon kunskap om fysik eller geometri. Men vi ville veta vad variablerna faktiskt var, inte bara deras antal."
Forskarna fortsatte sedan med att visualisera de faktiska variablerna som programmet identifierade. Att extrahera variablerna i sig var inte lätt, eftersom programmet inte kan beskriva dem på något intuitivt sätt som skulle vara begripligt för människor. Efter lite undersökning visade det sig att två av variablerna som programmet valde löst motsvarade armarnas vinklar, men de andra två förblir ett mysterium.
"Vi försökte korrelera de andra variablerna med allt vi kunde tänka på:vinkel- och linjära hastigheter, kinetisk och potentiell energi, och olika kombinationer av kända storheter," förklarade Boyuan Chen Ph.D., nu biträdande professor vid Duke University, som ledde arbetet. "Men ingenting verkade matcha perfekt." Teamet var övertygat om att AI hade hittat en giltig uppsättning av fyra variabler, eftersom den gjorde bra förutsägelser, "men vi förstår ännu inte det matematiska språket den talar", förklarade han.
Efter att ha validerat ett antal andra fysiska system med kända lösningar matade forskarna videor av system som de inte visste det explicita svaret på. De första videorna visade en "luftdansare" som böljade framför en lokal begagnad bilplats. Efter några timmars analys returnerade programmet åtta variabler. En video av en lavalampa producerade också åtta variabler. De matade sedan ett videoklipp med lågor från en semesterslinga med öppen spis, och programmet returnerade 24 variabler.
En särskilt intressant fråga var om variabeluppsättningen var unik för varje system, eller om en annan uppsättning producerades varje gång programmet startades om.
"Jag har alltid undrat, om vi någonsin träffat en intelligent utomjordisk ras, skulle de ha upptäckt samma fysiklagar som vi har, eller kan de beskriva universum på ett annat sätt?" sa Lipson. "Kanske vissa fenomen verkar gåtfullt komplexa eftersom vi försöker förstå dem med hjälp av fel uppsättning variabler. I experimenten var antalet variabler detsamma varje gång AI startade om, men de specifika variablerna var olika varje gång. Så ja, det finns alternativa sätt att beskriva universum och det är mycket möjligt att våra val inte är perfekta."
Forskarna tror att denna typ av AI kan hjälpa forskare att upptäcka komplexa fenomen för vilka teoretisk förståelse inte håller jämna steg med översvämningen av data – områden som sträcker sig från biologi till kosmologi. "Medan vi använde videodata i det här arbetet, kunde vilken typ av datakälla som helst användas - radarmatriser eller DNA-matriser, till exempel", förklarade Kuang Huang, Ph.D., som var medförfattare till uppsatsen.
Arbetet är en del av Lipson och Fu Foundations professor i matematik Qiang Dus decennier långa intresse för att skapa algoritmer som kan destillera data till vetenskapliga lagar. Tidigare mjukvarusystem, som Lipson och Michael Schmidts Eureqa-programvara, kunde destillera fysiska lagar i fria form från experimentella data, men bara om variablerna identifierades i förväg. Men vad händer om variablerna ännu är okända?
Lipson, som också är James och Sally Scapa professor i innovation, hävdar att forskare kanske misstolkar eller misslyckas med att förstå många fenomen helt enkelt för att de inte har en bra uppsättning variabler för att beskriva fenomenet.
"Under årtusenden visste folk om föremål som rörde sig snabbt eller långsamt, men det var först när begreppet hastighet och acceleration formellt kvantifierades som Newton kunde upptäcka sin berömda rörelselag F=MA," noterade Lipson. Variabler som beskriver temperatur och tryck behövde identifieras innan termodynamikens lagar kunde formaliseras, och så vidare för varje hörn av den vetenskapliga världen. Variablerna är en föregångare till vilken teori som helst.
"Vilka andra lagar saknar vi bara för att vi inte har variablerna?" frågade Du, som var med och ledde arbetet.
Uppsatsen var också medförfattare av Sunand Raghupathi och Ishaan Chandratreya, som hjälpte till att samla in data för experimenten. + Utforska vidare