PNNL -forskare använde 500, 000 vattenkluster från en nyligen utvecklad databas med över 5 miljoner vattenklusterminima för att träna ett neuralt nätverk som förlitar sig på grafteorins matematiska kraft - en samling noder och länkar som representerar molekylstruktur - för att dechiffrera strukturella mönster för aggregering av vattenmolekyler. Upphovsman:Nathan Johnson | PNNL
Maskininlärningsalgoritmer, grunden för neurala nätverk, öppnar dörrar till nya upptäckter - eller åtminstone erbjuder spännande ledtrådar - en massiv databas i taget. Fall i punkt:Pacific Northwest National Laboratory (PNNL) forskare fördjupade djupt i att modellera interaktionerna mellan vattenmolekyler, hitta information om vätebindningar och strukturella mönster medan du plöjer en väg med hjälp av - du gissade det - djup inlärning.
"Neurala nätverk är ett sätt för datorn att automatiskt lära sig olika egenskaper hos system eller data, "sa PNNL -datavetenskapare, Jenna påve. "I detta fall, det neurala nätverket lär sig energin i olika vattenklusternät baserat på tidigare data. "
PNNL -forskare använde 500, 000 vattenkluster från en nyligen utvecklad databas med över 5 miljoner vattenklusterminima för att träna ett neuralt nätverk som förlitar sig på grafteorins matematiska kraft - en samling noder och länkar som representerar molekylstruktur - för att dechiffrera strukturella mönster för aggregering av vattenmolekyler. Arbeta med det molekylära, gasformig vatten, de ägnade särskild uppmärksamhet åt sambandet mellan vätebindning och energi i förhållande till den mest stabila strukturen.
"Det är den heliga graalen, "sa påven." Just nu, det krävs mycket arbete för att utveckla en exakt interaktionspotential för vatten. Men med neurala nätverk, det slutliga målet är att få nätverken att lära sig, från en stor datamängd, vad är energin i ett nätverk baserat på dess underliggande molekylstruktur. "
Efter storleken på 500, 000 vattenkluster, det neurala nätverket i den PNNL-ledda studien utbildades i de olika sätt som vattenmolekyler interagerar med varandra. Datauppsättningen kunde teoretiskt ha inkluderat hela databasen med 5 miljoner vattennät. Men av praktiska skäl gjorde det inte det.
"Att använda hela databasen för att träna det neurala nätverket skulle ha tagit för mycket beräkningstid, "sade påven. Träna de djupa neurala nätverken för att undersöka dessa 500, 000 vattenkluster-bara en tiondel av hela databasen-tog mer än två och en halv dag med fyra toppmoderna datorer med stor grafikprocessor (GPU) -prestanda, arbetar dygnet runt.
Del av en större bild
Neurala nätverk har funnits i decennier. Större processorkraft för GPU -chips under de senaste 10 åren, dock, har kraftigt avancerat förmågan hos dessa nätverk, också associerad med frasen "djup inlärning". Även med ett sådant löfte, att träna neurala nätverk är en dyr beräkningsutmaning. Och så exakta de kan vara, neurala nätverk kritiseras ofta som svarta lådor som inte ger information om varför de ger svaret de gör.
Det amerikanska energidepartementets (DOE:s) Exascale Computing Project (ECP) lanserades 2016 för att utforska de mest svårhanterliga superdatorproblemen, inklusive förfining av neurala nätverk. År 2018, ECP skapade ExaLearn Co-Design Center, med fokus på maskininlärningsteknik. PNNL är bland åtta nationella laboratorier som deltar i ExaLearn -projektet. James Ang, PNNL:s chefsvetare för beräkning inom fysik och beräkningsvetenskap, leder laboratoriets deltagande.
Databas nära hemmet
Ett av ExaLearns stora mål är att utveckla artificiell intelligensteknik som kan designa nya kemiska strukturer genom att lära av massiva datamängder. Forskning som leds av Sutanay Choudhury, en PNNL -datavetare, använde sig av den massiva vattenklusterdatabasen som utvecklats på PNNL-Richland-campus av Sotiris Xantheas, en PNNL Laboratory fellow. Xantheas, känd inom kemisk fysik för sin forskning i intermolekylära interaktioner i vattenhaltiga joniska kluster, är en medförfattare till neurala nätverksstudien publicerad i specialnumret "Machine Learning Meets Chemical Physics" av Journal of Chemical Physics .
"Flera makroskopiska egenskaper hos vatten har tillskrivits dess flyktiga vätebindningsnät, som består av ett dynamiskt nätverk av bindningar som bryts och reformeras på en bråkdel av en sekund vid rumstemperatur, "sa Xantheas, vars databasarbete stöds av DOE:s vetenskapsbyrå, Grundläggande energivetenskapsprogram, Kemiska vetenskaper, Geovetenskap, och biovetenskapsavdelningen. "Vattenkluster ger en testbädd för att sondera detta flyktiga vätebindningsnätverk genom att förstå strukturen -energiförhållandet för de olika vätebindningsarrangemangen."
PNNL:s forskare hade en strategi för att dechiffrera just den här svarta lådan. De använde grafteori - en gren av matematik som studerar hur saker hänger ihop i ett nätverk - för att representera, i grafisk form, molekyler och deras polygonsubstrukturer. De grafteoretiska beskrivningarna som teamet utarbetade gav flera insikter om vattenklungornas smink.
"Det vi har gjort, "sa påven, "tillhandahåller ytterligare analys efter att nätverket har utbildats. Analysen kvantifierar olika strukturella egenskaper hos dessa vattenklusternät. Sedan kan vi jämföra dem med vårt förutsagda neurala nätverk och, vid efterföljande datauppsättningsundersökningar, förbättra nätverkets förståelse. "
Vatten har en neurologisk nätverksframtid
Studiens resultat ger en grund för analys av vattenkluster strukturella mönster i mer komplexa vätebundna nätverk, som flytande vatten och is.
"Om du kunde träna ett neuralt nätverk, "sa påven, "det neurala nätverket skulle kunna göra beräkningskemi på större system. Och sedan kan du göra liknande insikter i beräkningskemi om kemisk struktur eller vätebindning eller molekylernas svar på temperaturförändringar. Det är bland målen för denna forskning."