Kredit:Pixabay/CC0 Public Domain
Datorer har kunnat snabbt bearbeta 2D-bilder under en tid. Din mobiltelefon kan ta digitala fotografier och manipulera dem på ett antal sätt. Mycket svårare, dock, bearbetar en bild i tre dimensioner, och gör det i tid. Matematiken är mer komplex, och krossa de siffrorna, även på en superdator, tar tid.
Det är utmaningen som en grupp forskare från det amerikanska energidepartementets (DOE) Argonne National Laboratory arbetar för att övervinna. Artificiell intelligens har dykt upp som en mångsidig lösning på problemen med stordatabehandling. För forskare som använder Advanced Photon Source (APS), en DOE Office of Science User Facility i Argonne, att bearbeta 3D-bilder, det kan vara nyckeln till att göra röntgendata till synliga, förståeliga former i mycket snabbare takt. Ett genombrott på detta område kan få konsekvenser för astronomi, elektronmikroskopi och andra vetenskapsområden som är beroende av stora mängder 3D-data.
"För att fullt ut kunna använda vad den uppgraderade APS kommer att kunna, vi måste återuppfinna dataanalys. Våra nuvarande metoder räcker inte för att hänga med. Maskininlärning kan dra full nytta och gå utöver vad som för närvarande är möjligt, " säger Mathew Cherukara från Argonne National Laboratory
Forskargruppen, som inkluderar forskare från tre Argonne-divisioner, har utvecklat ett nytt beräkningsramverk som heter 3D-CDI-NN, och har visat att det kan skapa 3D-visualiseringar från data som samlats in vid APS hundratals gånger snabbare än vad traditionella metoder kan. Teamets forskning publicerades i Tillämpad fysik recensioner , en publikation från American Institute of Physics.
CDI står för coherent diffraction imaging, en röntgenteknik som innebär att ultraljusa röntgenstrålar studsar bort från prover. Dessa ljusstrålar kommer sedan att samlas in av detektorer som data, och det krävs en viss beräkningsansträngning för att omvandla den datan till bilder. En del av utmaningen, förklarar Mathew Cherukara, ledare för Computational X-ray Science-gruppen i Argonnes X-ray Science Division (XSD), är att detektorerna bara fångar en del av informationen från strålarna.
Men det finns viktig information i de saknade uppgifterna, och forskare litar på datorer för att fylla i den informationen. Som Cherukara noterar, medan detta tar lite tid att göra i 2D, det tar ännu längre tid att göra med 3D-bilder. Lösningen, sedan, är att träna en artificiell intelligens att känna igen objekt och de mikroskopiska förändringar de genomgår direkt från rådata, utan att behöva fylla i den saknade informationen.
Att göra detta, teamet började med simulerade röntgendata för att träna det neurala nätverket. NN i ramens titel, ett neuralt nätverk är en serie algoritmer som kan lära en dator att förutsäga utfall baserat på data som den tar emot. Henry Chan, huvudförfattaren på uppsatsen och en postdoktor vid Center for Nanoscale Materials (CNM), en DOE Office of Science User Facility i Argonne, ledde denna del av arbetet.
"Vi använde datorsimuleringar för att skapa kristaller av olika former och storlekar, och vi omvandlade dem till bilder och diffraktionsmönster för det neurala nätverket att lära sig, ", sade Chan. "Lättheten att snabbt generera många realistiska kristaller för träning är fördelen med simuleringar."
Detta arbete gjordes med hjälp av resurserna för grafikbehandlingsenhet vid Argonnes gemensamma laboratorium för systemutvärdering, som distribuerar ledande testbäddar för att möjliggöra forskning om framväxande högpresterande datorplattformar och kapaciteter.
När nätverket är utbildat, säger Stephan Hruszkewycz, fysiker och gruppledare vid Argonnes materialvetenskapsavdelning, det kan komma ganska nära det rätta svaret, ganska snabbt. Dock, det finns fortfarande utrymme för förfining, så ramverket för 3D-CDI-NN inkluderar en process för att få nätverket resten av vägen dit. Hruszkewycz, tillsammans med Northwestern University doktorand Saugat Kandel, arbetade med denna aspekt av projektet, vilket minskar behovet av tidskrävande iterativa steg.
"Materialvetenskapsavdelningen bryr sig om koherent diffraktion eftersom du kan se material på några nanometers längdskalor - cirka 100, 000 gånger mindre än bredden på ett människohår – med röntgenstrålar som tränger in i miljöer, ", sa Hruszkewycz. "Det här dokumentet är en demonstration av dessa avancerade metoder, och det underlättar avbildningsprocessen avsevärt. Vi vill veta vad ett material är, och hur det förändras över tid, och detta kommer att hjälpa oss att ta bättre bilder av det när vi gör mätningar."
Som ett sista steg, 3D-CDI-NN:s förmåga att fylla i saknad information och komma med en 3D-visualisering testades på riktiga röntgendata från små partiklar av guld, uppsamlade vid strållinje 34-ID-C vid APS. Resultatet är en beräkningsmetod som är hundratals gånger snabbare på simulerad data, och nästan så snabbt på riktiga APS-data. Testerna visade också att nätverket kan rekonstruera bilder med mindre data än vad som vanligtvis krävs för att kompensera för informationen som inte fångas upp av detektorerna.
Nästa steg för denna forskning, enligt Chan, är att integrera nätverket i APS:s arbetsflöde, så att den lär sig av data när den tas. Om nätverket lär sig av data vid strållinjen, han sa, det kommer att förbättras kontinuerligt.
För det här laget, det finns ett tidselement i denna forskning också. Som Cherukara påpekar, en massiv uppgradering av APS är på gång, och mängden data som genereras nu kommer att öka exponentiellt när projektet är klart. Den uppgraderade APS kommer att generera röntgenstrålar som är upp till 500 gånger ljusare, och strålens koherens – egenskapen hos ljus som gör att den kan diffraktera på ett sätt som kodar för mer information om provet – kommer att öka avsevärt.
Det betyder att även om det tar två till tre minuter nu att samla in koherent diffraktionsbilddata från ett prov och få en bild, datainsamlingsdelen av den processen kommer snart att vara upp till 500 gånger snabbare. Processen att konvertera den datan till en användbar bild måste också vara hundratals gånger snabbare än den är nu för att hänga med.
"För att fullt ut kunna använda vad den uppgraderade APS kommer att kunna, vi måste återuppfinna dataanalys, ", sa Cherukara. "Våra nuvarande metoder räcker inte för att hänga med. Maskininlärning kan dra full nytta och gå utöver vad som för närvarande är möjligt."
Förutom Chan, Cherukara och Hruszkewycz, författare på tidningen inkluderar Subramanian Sankaranarayanan och Ross Harder, båda av Argonne; Youssef Nashed från SLAC National Accelerator Laboratory; och Saugat Kandel från Northwestern University.