Konstnärens intryck av maskininlärningsarkitekturen som uttryckligen kodar mätsymmetri för en 2D-gitterfältteori. Kredit:MIT-DeepMind-samarbete.
Standardmodellen för partikelfysik beskriver alla kända elementarpartiklar och tre av de fyra fundamentala krafterna som styr universum; allt utom gravitationen. Dessa tre krafter - elektromagnetiska, stark, och svag – styr hur partiklar bildas, hur de interagerar, och hur partiklarna sönderfaller.
Studera partikel- och kärnfysik inom denna ram, dock, är svårt, och förlitar sig på storskaliga numeriska studier. Till exempel, många aspekter av den starka kraften kräver numerisk simulering av dynamiken på skalan från 1/10 till 1/100 av en protons storlek för att svara på grundläggande frågor om protonernas egenskaper, neutroner, och kärnor.
"I sista hand, vi är beräkningsmässigt begränsade i studien av proton och kärnstruktur med hjälp av gitterfältteori, " säger biträdande professor i fysik Phiala Shanahan. "Det finns många intressanta problem som vi vet hur vi ska lösa i princip, men vi har helt enkelt inte tillräckligt med beräkningar, även om vi kör på de största superdatorerna i världen."
För att komma förbi dessa begränsningar, Shanahan leder en grupp som kombinerar teoretisk fysik med modeller för maskininlärning. I deras artikel "Ekvivariant flödesbaserad sampling för gittermåttteori, "publicerad denna månad i Fysiska granskningsbrev , de visar hur integrering av fysiksteorins symmetrier i maskininlärning och artificiell intelligensarkitekturer kan ge mycket snabbare algoritmer för teoretisk fysik.
"Vi använder maskininlärning för att inte analysera stora mängder data, men att påskynda teorin om de första principerna på ett sätt som inte äventyrar tillvägagångssättets stränghet, "Säger Shanahan." Detta speciella arbete visade att vi kan bygga maskininlärningsarkitekturer med några av symmetrierna i standardmodellen för partikel- och kärnfysik inbyggd, och påskynda provtagningsproblemet vi riktar in oss på i storleksordningar."
Shanahan lanserade projektet med MIT -doktoranden Gurtej Kanwar och med Michael Albergo, som nu är på NYU. Projektet utökades till att omfatta Center for Theoretical Physics postdoktorer Daniel Hackett och Denis Boyda, NYU professor Kyle Cranmer, och fysikkunniga maskinlärande forskare på Google Deep Mind, Sébastien Racanière och Danilo Jimenez Rezende.
Denna månads uppsats är en i serien som syftar till att möjliggöra studier i teoretisk fysik som för närvarande är beräkningsmässigt svårhanterliga. "Vårt mål är att utveckla nya algoritmer för en nyckelkomponent i numeriska beräkningar inom teoretisk fysik, " säger Kanwar. "Dessa beräkningar informerar oss om det inre arbetet hos standardmodellen för partikelfysik, vår mest grundläggande teori om materien. Sådana beräkningar är av avgörande betydelse för att jämföra med resultat från partikelfysikexperiment, som Large Hadron Collider vid CERN, både för att begränsa modellen mer exakt och för att upptäcka var modellen går sönder och måste utvidgas till något ännu mer fundamentalt."
Den enda kända systematiskt kontrollerbara metoden för att studera standardmodellen för partikelfysik i den icke -störande regimen är baserad på ett urval av ögonblicksbilder av kvantfluktuationer i vakuumet. Genom att mäta egenskaperna hos dessa fluktuationer, en gång kan härleda egenskaper hos partiklarna och kollisioner av intresse.
Denna teknik kommer med utmaningar, Kanwar förklarar. "Det här provet är dyrt, och vi funderar på att använda fysikinspirerade maskininlärningstekniker för att dra prover mycket mer effektivt, "säger han." Maskininlärning har redan gjort stora framsteg när det gäller att skapa bilder, Inklusive, till exempel, senaste arbete av NVIDIA för att skapa bilder av ansikten som "drömts upp" av neurala nätverk. Tänker på dessa ögonblicksbilder av vakuumet som bilder, vi tycker att det är ganska naturligt att vända sig till liknande metoder för vårt problem."
Lägger till Shanahan, "I vårt tillvägagångssätt för att ta prov på dessa kvantbilder, vi optimerar en modell som tar oss från ett utrymme som är lätt att prova till målutrymmet:givet en tränad modell, provtagning är då effektiv eftersom du bara behöver ta oberoende prover i det lätta att ta prov på, och förvandla dem via den inlärda modellen. "
Särskilt, gruppen har infört en ram för att bygga maskininlärningsmodeller som exakt respekterar en klass av symmetrier, kallas "mätare symmetrier, "avgörande för att studera högenergifysik.
Som ett principbevis, Shanahan och kollegor använde sitt ramverk för att träna maskininlärningsmodeller för att simulera en teori i två dimensioner, vilket resulterar i storleksordningsgrader för effektivitet jämfört med toppmoderna tekniker och mer exakta förutsägelser från teorin. Detta banar väg för avsevärt accelererad forskning om naturens grundläggande krafter med hjälp av fysikinformerad maskininlärning.
Gruppens första artiklar som ett samarbete diskuterade att tillämpa maskininlärningstekniken på en enkel gitterfältteori, och utvecklade denna klass av metoder för kompakta, anslutna grenrör som beskriver standardmodellens mer komplicerade fältteorier. Nu arbetar man med att skala teknikerna till toppmoderna beräkningar.
"Jag tror att vi har visat det senaste året att det finns mycket löfte i att kombinera fysikkunskap med maskininlärningstekniker, " säger Kanwar. "Vi funderar aktivt på hur vi ska ta itu med de återstående hindren i sättet att utföra fullskaliga simuleringar med vårt tillvägagångssätt. Jag hoppas få se den första tillämpningen av dessa metoder på beräkningar i stor skala under de närmaste åren. Om vi kan övervinna de sista hindren, detta lovar att utöka vad vi kan göra med begränsade resurser, och jag drömmer om att snart utföra beräkningar som ger oss nya insikter i vad som ligger bortom vår bästa förståelse av fysik idag."
Denna idé om fysikinformerad maskininlärning är också känd av teamet som "ab-initio AI, "ett centralt tema för det nyligen lanserade MIT-baserade National Science Foundation Institute for Artificial Intelligence and Fundamental Interactions (IAIFI), där Shanahan är forskningskoordinator för fysikteori.