Kredit:International School of Advanced Studies (SISSA)
Information är kodad i data. Detta är sant för de flesta aspekter av det moderna livet, men det är också sant i de flesta grenar av samtida fysik, och att extrahera användbar och meningsfull information från mycket stora datamängder är ett nyckeluppdrag för många fysiker.
I statistisk mekanik, stora datamängder är daglig verksamhet. Ett klassiskt exempel är partitionsfunktionen, ett komplext matematiskt objekt som beskriver fysiska system i jämvikt. Detta matematiska objekt kan ses som att det består av många punkter, var och en beskriver en grad av frihet för ett fysiskt system – det vill säga, det minsta antalet data som kan beskriva alla dess egenskaper.
Ett tvärvetenskapligt team av forskare från Abdus Salam International Centre for Theoretical Physics (ICTP) och Scuola Internazionale Superiore di Studi Avanzati (SISSA) visade att en så enorm insamling av data kan kammas igenom, ta fram grundläggande fysikaliska egenskaper hos ett okänt system.
Dessa resultat lyftes fram i en tidning som just publicerats i Fysisk granskning X , införa en ny databaserad syn på fasövergångar. Teamet visade att en generisk statistisk egenskap hos stora datamängder som beskriver ett brett spektrum av fysiska system i jämvikt, känd som inneboende dimension, kan faktiskt avslöja förekomsten av en fasövergång.
Författarna till tidningen, koordinerad av Marcello Dalmonte, en forskare vid ICTP:s sektion för kondenserad materia och statistisk fysik och SISSA-samarbetspartner, kommer från olika bakgrunder. Tiago Mendes, en tidigare postdoktor vid ICTP och nu vid Max Planck Institute for the Physics of Complex Systems, i Dresden, Tyskland, arbetar huvudsakligen med numeriska metoder tillämpade på statistisk mekanik. Alex Rodriguez är en kemist, arbetade tidigare på SISSA och nu på ICTP, som arbetar med implementering av komplexa systemalgoritmer och utveckling av maskininlärningsmetoder. Xhek Turkeshi, en Ph.D. student på SISSA, arbetar mest inom statistisk fysik.
Forskarna fokuserade på en generisk statistisk egenskap hos datamängderna, kallas den inneboende dimensionen. Det enklaste sättet att beskriva denna egenskap är som det minsta antalet variabler som behövs för att representera en given datamängd, utan förlust av information. "Ta, till exempel, alla människor runt om i världen, " förklarar Rodriguez. "Det är en datauppsättning av sig själv. Nu, om du vill specificera ställningen för människorna runt om i världen, i teorin, du skulle behöva koordinaterna för alla deras positioner i rymden, det är, tre uppgifter för varje person. Men eftersom vi kan approximera jorden som en tvådimensionell yta, vi behöver bara två parametrar, det är, latitud och longitud. Detta är vad den inneboende dimensionen är:om datamängden var mänskligheten skulle den inneboende dimensionen vara 2, inte 3."
I det mer teoretiska sammanhanget av statistiska system, uppsatsen visar att denna egenskap av inneboende dimension kan avslöja kollektiva egenskaper hos partitionsfunktioner vid termiska fasövergångar. Detta innebär att, oavsett vilket system som övervägs, data kan visa om och när systemet genomgår en fasövergång. Teamet har utvecklat ett teoretiskt ramverk för att förklara varför generiska data uppvisar ett sådant "universellt" beteende, gemensamt för ett brett spektrum av olika fasövergångar, från smältande is till ferromagneter.
"Arbetet introducerar en ny syn på fasövergångar genom att visa hur den inneboende dimensionen avslöjar motsvarande strukturella övergångar i datarymden, säger forskarna, "när is smälter, dess datastruktur gör det också."
Vad som verkligen är nytt i det här arbetet är att rådata speglar det fysiska beteendet hos systemen som övervägs, och det är viktigt för fysiker, eftersom det tillåter dem att analysera ett system utan att känna till fysiken som ligger bakom det. Att titta på data är tillräckligt för att se om det sker en övergång i systemet eller inte, utan att ens veta vilken typ av övergång det är. "Vi kan säga att den här metoden är helt agnostisk, " säger Mendes. "Du behöver inte på förhand känna till alla parametrar i systemet; du bara arbetar med rådata och ser vad som kommer ut ur dem."
Efter de intressanta resultaten som erhållits i denna forskning, teamet planerar att fortsätta arbeta tillsammans i samma riktning, bredda sitt analysområde. De arbetar redan på en andra tidning, med fokus på de så kallade "kvantfasövergångarna", det är, kvantsystem där fasövergångar sker vid en temperatur lika med noll och induceras av externa parametrar, som magnetfältet.
När det gäller tillämpningar av dessa fynd, möjligheterna är många – från experiment med datorsimuleringar av kvantsystem till mer grundläggande grenar av fysiken, såsom kvantkromodynamik, som också kan ha en inverkan på kärnfysiken. "En intressant tillämpningsmöjlighet är att använda statistiska fysiktekniker för att förstå maskininlärning, " säger Rodriguez. "I den här typen av forskning, som går från kvantberäkning till studier av neurala nätverk till exempel, fasövergångar är väldigt ofta involverade och vi skulle kunna försöka använda vår metod för att ta itu med alla dessa typer av olika problem."