Ett exempel på 3D-röntgendiffraktionsdata som går igenom en fasövergång vid kylning. Den magentafärgade plotten visar speciella punkter associerade med laddningstäthetsvågbildning när de avslöjades av maskininlärningsalgoritmen X-TEC. Kredit:Krishna Mallayya/Provided
Elektroner och deras beteende ställer fascinerande frågor för kvantfysiker, och de senaste innovationerna i källor, instrument och anläggningar tillåter forskare att potentiellt få tillgång till ännu mer av den information som är kodad i kvantmaterial.
Dessa forskningsinnovationer producerar dock oöverträffade – och hittills obegripliga – mängder data.
"Informationsinnehållet i ett material kan snabbt överstiga det totala informationsinnehållet i Library of Congress, vilket är cirka 20 terabyte", säger Eun-Ah Kim, professor i fysik vid College of Arts and Sciences, som är på framkanten av både kvantmaterialforskning och utnyttjande av kraften i maskininlärning för att analysera data från kvantmaterialexperiment.
"Den begränsade kapaciteten hos det traditionella analyssättet – till stor del manuellt – håller snabbt på att bli den kritiska flaskhalsen," sa Kim.
En grupp ledd av Kim har framgångsrikt använt en maskininlärningsteknik utvecklad med Cornells datavetare för att analysera enorma mängder data från kvantmetallen Cd2 Åter2 O7 , lösa en debatt om just detta material och sätta scenen för framtida maskininlärning som underlättar insikten i nya faser av materien.
Uppsatsen, "Harnessing Interpretable and Unsupervised Machine Learning to Address Big Data from Modern X-ray Diffraction", publicerades den 9 juni i Proceedings of the National Academy of Sciences .
Cornell-fysiker och datavetare samarbetade för att bygga en oövervakad och tolkningsbar maskininlärningsalgoritm, XRD Temperature Clustering (X-TEC). Forskarna använde sedan X-TEC för att undersöka nyckelelementen i pyrokloroxidmetallen, Cd2 Åter2 O7 .
X-TEC analyserade åtta terabyte röntgendata, som spänner över 15 000 Brillouin-zoner (unikt definierade celler), på några minuter.
"Vi använde oövervakade algoritmer för maskininlärning, som är en perfekt passform för att översätta högdimensionell data till kluster som är vettiga för människor", säger Kilian Weinberger, professor i datavetenskap i Cornell Ann. S Bowers College of Computing and Information Science.
Tack vare denna analys upptäckte forskarna viktiga insikter om elektronbeteende i materialet, och upptäckte det som kallas pseudo-Goldstone-läget. De försökte förstå hur atomer och elektroner positionerar sig på ett ordnat sätt för att optimera interaktionen inom den astronomiskt stora "gemenskapen" av elektroner och atomer.
"I komplexa kristallina material, en specifik struktur av flera atomer, enhetscellen, upprepar sig i ett vanligt arrangemang som i ett höghus lägenhetskomplex," sa Kim. "Ompositioneringen vi upptäckte sker i en skala av varje lägenhetsenhet, över hela komplexet."
Eftersom arrangemanget av enheterna förblir detsamma, sa hon, är det svårt att upptäcka denna ompositionering genom att titta från utsidan. Emellertid bryter ompositioneringen nästan spontant en kontinuerlig symmetri, vilket resulterar i ett pseudo-Goldstone-läge.
"Förekomsten av pseudo-Goldstone-läge kan avslöja de hemliga symmetrierna i systemet som annars kan vara svåra att se," sa Kim. "Vår upptäckt aktiverades av X-TEC."
Denna upptäckt är betydelsefull av tre skäl, sa Kim. För det första visar det att maskininlärning kan användas för att analysera voluminös röntgenpulverdiffraktionsdata (XRD), som fungerar som en prototyp för tillämpningar av X-TEC när den skalas upp. X-TEC, tillgängligt för forskare som ett mjukvarupaket, kommer att integreras i synkrotronen som ett analysverktyg vid Advanced Photon Source och vid Cornell High Energy Synchrotron Source.
För det andra avgör upptäckten en debatt om fysiken för Cd2 Åter2 O7 .
"Såvitt vi vet är detta den första instansen av upptäckten av ett Goldstone-läge med XRD," sa Kim. "Denna insikt i atomär skala i fluktuationer i ett komplext kvantmaterial kommer bara att vara det första exemplet på att besvara viktiga vetenskapliga frågor som åtföljer alla upptäckter av nya faser av materia ... med hjälp av informationsrika voluminösa diffraktionsdata."
För det tredje visar upptäckten upp vad samarbete mellan fysiker och datavetare kan åstadkomma.
"De matematiska inre funktionerna hos maskininlärningsalgoritmer är ofta inte olikt modeller inom fysik utan tillämpas på högdimensionella data," sa Weinberger. "Att arbeta med fysiker är väldigt roligt, eftersom de är så bra på att modellera den naturliga världen. När det kommer till datamodellering är de verkligen igång." + Utforska vidare