När vatten fryser övergår det från en flytande fas till en fast fas, vilket resulterar i en drastisk förändring av egenskaper som densitet och volym. Fasövergångar i vatten är så vanliga att de flesta av oss förmodligen inte ens tänker på dem, men fasövergångar i nya material eller komplexa fysiska system är ett viktigt studieområde.
För att fullt ut förstå dessa system måste forskare kunna känna igen faser och upptäcka övergångarna mellan. Men hur man kvantifierar fasförändringar i ett okänt system är ofta oklart, särskilt när data är knappa.
Forskare från MIT och University of Basel i Schweiz tillämpade generativa modeller för artificiell intelligens på detta problem och utvecklade ett nytt ramverk för maskininlärning som automatiskt kan kartlägga fasdiagram för nya fysiska system.
Deras fysikinformerade maskininlärningsmetod är effektivare än mödosamma, manuella tekniker som bygger på teoretisk expertis. Viktigt, eftersom deras tillvägagångssätt utnyttjar generativa modeller, kräver det inte stora, märkta utbildningsdataset som används i andra maskininlärningstekniker.
En sådan ram skulle kunna hjälpa forskare att undersöka de termodynamiska egenskaperna hos nya material eller upptäcka intrassling i kvantsystem, till exempel. I slutändan kan denna teknik göra det möjligt för forskare att självständigt upptäcka okända faser av materia.
"Om du har ett nytt system med helt okända egenskaper, hur skulle du välja vilken observerbar kvantitet du ska studera? Förhoppningen, åtminstone med datadrivna verktyg, är att du skulle kunna skanna stora nya system på ett automatiserat sätt, och det kommer att peka på dig till viktiga förändringar i systemet.
"Detta kan vara ett verktyg i pipelinen för automatiserad vetenskaplig upptäckt av nya, exotiska egenskaper hos faser", säger Frank Schäfer, postdoktor vid Julia Lab i Computer Science and Artificial Intelligence Laboratory (CSAIL) och medförfattare till en artikel på detta tillvägagångssätt.
Första författaren Julian Arnold, en doktorand vid universitetet i Basel, ansluter sig till Schäfer på tidningen; Alan Edelman, professor i tillämpad matematik vid institutionen för matematik och ledare för Julia Lab; och senior författare Christoph Bruder, professor vid institutionen för fysik vid universitetet i Basel.
Forskningen publiceras i Physical Review Letters .
Även om vatten som övergår till is kan vara bland de mest uppenbara exemplen på en fasförändring, är mer exotiska fasförändringar, som när ett material övergår från att vara en normal ledare till en supraledare, av stort intresse för forskare.
Dessa övergångar kan detekteras genom att identifiera en "orderparameter", en kvantitet som är viktig och förväntas förändras. Till exempel fryser vatten och övergår till en fast fas (is) när dess temperatur sjunker under 0°C. I det här fallet skulle en lämplig ordningsparameter kunna definieras i termer av andelen vattenmolekyler som är en del av det kristallina gittret kontra de som förblir i ett oordnat tillstånd.
Tidigare har forskare förlitat sig på fysikexpertis för att bygga fasdiagram manuellt, med hjälp av teoretisk förståelse för att veta vilka ordningsparametrar som är viktiga. Detta är inte bara tråkigt för komplexa system, och kanske omöjligt för okända system med nya beteenden, utan det introducerar också mänsklig fördom i lösningen.
På senare tid har forskare börjat använda maskininlärning för att bygga diskriminerande klassificerare som kan lösa denna uppgift genom att lära sig att klassificera en mätstatistik som att den kommer från en viss fas av det fysiska systemet, på samma sätt som sådana modeller klassificerar en bild som en katt eller hund.
MIT-forskarna visade hur generativa modeller kan användas för att lösa denna klassificeringsuppgift mycket mer effektivt och på ett fysikinformerat sätt.
Julia Programming Language, ett populärt språk för vetenskaplig beräkning som också används i MIT:s inledande linjära algebraklasser, erbjuder många verktyg som gör det ovärderligt för att konstruera sådana generativa modeller, tillägger Schäfer.
Generativa modeller, som de som ligger bakom ChatGPT och Dall-E, fungerar vanligtvis genom att uppskatta sannolikhetsfördelningen för vissa data, som de använder för att generera nya datapunkter som passar fördelningen (som nya kattbilder som liknar befintliga kattbilder) .
Men när simuleringar av ett fysiskt system med beprövade vetenskapliga tekniker är tillgängliga, får forskarna en modell av dess sannolikhetsfördelning gratis. Denna fördelning beskriver mätstatistiken för det fysiska systemet.
MIT-teamets insikt är att denna sannolikhetsfördelning också definierar en generativ modell på vilken en klassificerare kan konstrueras. De kopplar in den generativa modellen i statistiska standardformler för att direkt konstruera en klassificerare istället för att lära sig den från prover, som man gjorde med diskriminerande tillvägagångssätt.
"Det här är ett riktigt bra sätt att införliva något du vet om ditt fysiska system djupt i ditt maskininlärningsschema. Det går långt utöver att bara utföra funktionsteknik på dina dataprover eller enkla induktiva fördomar", säger Schäfer.
Denna generativa klassificerare kan bestämma vilken fas systemet befinner sig i givet någon parameter, som temperatur eller tryck. Och eftersom forskarna direkt approximerar sannolikhetsfördelningarna bakom mätningar från det fysiska systemet, har klassificeraren systemkunskap.
Detta gör att deras metod presterar bättre än andra maskininlärningstekniker. Och eftersom det kan fungera automatiskt utan behov av omfattande utbildning, förbättrar deras tillvägagångssätt avsevärt beräkningseffektiviteten för att identifiera fasövergångar.
I slutet av dagen, i likhet med hur man kan be ChatGPT att lösa ett matematiskt problem, kan forskarna ställa frågor till den generativa klassificeraren som "tillhör det här provet fas I eller fas II?" eller "genererades detta prov vid hög temperatur eller låg temperatur?"
Forskare skulle också kunna använda detta tillvägagångssätt för att lösa olika binära klassificeringsuppgifter i fysiska system, möjligen för att upptäcka intrassling i kvantsystem (Är staten intrasslad eller inte?) eller avgöra om teori A eller B är bäst lämpad för att lösa ett visst problem. De skulle också kunna använda det här tillvägagångssättet för att bättre förstå och förbättra stora språkmodeller som ChatGPT genom att identifiera hur vissa parametrar ska ställas in så att chatboten ger de bästa resultaten.
I framtiden vill forskarna också studera teoretiska garantier för hur många mätningar de skulle behöva för att effektivt upptäcka fasövergångar och uppskatta mängden beräkning som skulle krävas.