Maskininlärning ger en färgkodad karta över röntgendata baserat på temperaturberoendet för varje region. X-TEC identifierade placeringen av två uppsättningar av skarpa toppar (gula och gröna rutor) i data, såväl som diffusa spridningshalos runt dem (röda och blå). Kredit:Argonne National Laboratory
Färgkodning gör flygkartor mycket lättare att förstå. Genom färg kan vi med ett ögonkast se var det finns en väg, skog, öken, stad, flod eller sjö.
I samarbete med flera universitet har U.S. Department of Energys (DOE) Argonne National Laboratory tagit fram en metod för att skapa färgkodade grafer av stora volymer data från röntgenanalys. Det här nya verktyget använder beräkningsdatasortering för att hitta kluster relaterade till fysiska egenskaper, såsom en atomär distorsion i en kristallstruktur. Det borde avsevärt påskynda framtida forskning om strukturella förändringar på atomär skala som induceras av varierande temperatur.
Forskargruppen publicerade sina resultat i Proceedings of the National Academy of Sciences i en artikel med titeln "Användning av tolkningsbar och oövervakad maskininlärning för att hantera stora data från modern röntgendiffraktion."
"Vår metod använder maskininlärning för att snabbt analysera enorma mängder data från röntgendiffraktion", säger Raymond Osborn, senior fysiker vid Argonnes materialvetenskapsavdelning. "Det som kan ha tagit oss månader tidigare tar nu ungefär en kvart, med mycket mer finkorniga resultat."
I över ett sekel har röntgendiffraktion (eller XRD) varit en av de mest fruktbara av alla vetenskapliga metoder för att analysera material. Den har gett nyckelinformation om 3D-atomstrukturen hos otaliga tekniskt viktiga material.
Under de senaste decennierna har mängden data som produceras i XRD-experiment ökat dramatiskt vid stora anläggningar som Advanced Photon Source (APS), en DOE Office of Science-användaranläggning i Argonne. Däremot saknas analysmetoder som kan hantera dessa enorma datamängder.
Teamet kallar sin nya metod för X-ray Temperature Clustering, eller förkortat XTEC. Det påskyndar materialupptäckten genom snabb klustring och färgkodning av stora röntgendatauppsättningar för att avslöja tidigare dolda strukturella förändringar som inträffar när temperaturen ökar eller minskar. En typisk stor datamängd skulle vara 10 000 gigabyte, vilket motsvarar ungefär 3 miljoner låtar med strömmande musik.
XTEC använder sig av kraften i oövervakad maskininlärning, med metoder som utvecklats för detta projekt vid Cornell University. Denna maskininlärning är inte beroende av inledande träning och inlärning med redan väl studerade data. Istället lär den sig genom att hitta mönster och kluster i stora datamängder utan sådan träning. Dessa mönster representeras sedan av färgkodning.
"Till exempel kan XTEC tilldela rött till datakluster ett, som är associerat med en viss egenskap som förändras med temperaturen på ett visst sätt," sa Osborn. "Då skulle kluster två vara blått och associerat med en annan egenskap med ett annat temperaturberoende och så vidare. Färgerna berättar om varje kluster representerar motsvarigheten till en väg, skog eller sjö på en flygkarta."
Som ett testfall analyserade XTEC data från strållinje 6-ID-D vid APS, tagna från två kristallina material som är supraledande vid temperaturer nära absolut noll. Vid denna ultralåga temperatur växlar dessa material till ett supraledande tillstånd och ger inget motstånd mot elektrisk ström. Viktigare för denna studie, andra ovanliga egenskaper dyker upp vid högre temperaturer relaterade till förändringar i materialstrukturen.
Genom att tillämpa XTEC extraherade teamet en oöverträffad mängd information om förändringar i atomstruktur vid olika temperaturer. Dessa inkluderar inte bara förvrängningar i det ordnade arrangemanget av atomer i materialet, utan också fluktuationer som uppstår när sådana förändringar inträffar.
"På grund av maskininlärning kan vi se materialens beteende som inte syns av konventionell XRD," sa Osborn. "Och vår metod är tillämplig på många stora dataproblem i inte bara supraledare, utan även batterier, solceller och alla temperaturkänsliga enheter."
APS genomgår en massiv uppgradering som kommer att öka ljusstyrkan på dess röntgenstrålar med upp till 500 gånger. Tillsammans med uppgraderingen kommer en betydande ökning av data som samlas in vid APS, och maskininlärningstekniker kommer att vara avgörande för att analysera dessa data i tid. + Utforska vidare