Förhållandet mellan BBB-testsystemen och fraktionellladdningsatomerna från träningssetet. Kredit:Michael Medvedev (Zelinsky Institute of Organic Chemistry of RAS)
I deras tidning publicerad i Science i december 2021 visade ett DeepMind-team hur neurala nätverk kan användas för att beskriva elektroninteraktioner i kemiska system mer exakt än befintliga metoder. Ett team av forskare från Skoltech, Zelinsky Institute of Organic Chemistry, HSE University, Yandex och Kyungpook National University visar i sin kommentar i Science att DeepMind AI:s förmåga att generalisera beteendet hos sådana system inte följer av de publicerade resultaten och kräver återbesök.
Att veta var elektronerna finns inom en molekyl kan gå långt för att förklara dess struktur, dess egenskaper och dess reaktivitet. Kemister använder metoder för densitetsfunktionsteori (DFT), approximationer till Schrödingers ekvation, för att göra exakta och beräkningseffektiva modeller av molekyler och material. Men det finns välkända omständigheter där DFT-verktyg misslyckas. En är att förutsäga hur atomer delar elektroner; i ett berömt exempel förutsäger DFT-metoder felaktigt att även när en klor- och en natriumatom är oändligt långt ifrån varandra, behåller kloratomen en bråkdel av en av natriumatomens elektroner.
Sådana fel uppstår eftersom DFT-ekvationer bara är approximationer av den fysiska verkligheten. Forskare från maskininlärningsprojektet DeepMind säger att deras neurala nätverk eliminerar detta del-av-en-elektronfel och gör mer exakta förutsägelser än traditionella DFT-metoder
"I kärnan är DFT en metod för att lösa Schrödinger-ekvationen. Dess noggrannhet bestäms av dess utbyteskorrelationsdel, som tyvärr är okänd. Hittills har över 400 distinkta approximationer för denna del föreslagits", säger Petr Zhyliaev , senior forskare vid Skoltech.
"Ett sätt att bygga en bra utbyteskorrelationsdel är att överföra information om den från mer "avancerade" numeriska metoder än densitetsfunktionella teorin, som dock är storleksordningar mindre beräkningseffektiva. I sitt arbete använde DeepMind en neural nätverk som en universell interpolator för att lära sig utbytes-korrelationsdelen av det funktionella. Deras försök var inte det överlägset första, men är ett av de mest ambitiösa."
DeepMind konstruerade en neural nätverksbaserad densitetsfunktion betecknad som DM21, tränad på fraktionella elektronsystem, såsom en väteatom med en halv elektron. För att bevisa dess överlägsenhet har författarna testat DM21 på en uppsättning sträckta dimerer (kallade BBB-set), t.ex. två väteatomer på stort avstånd med totalt en elektron.
Förväntat visar DM21-funktionerna en utmärkt prestanda på BBB-testsetet, och överträffar i särklass alla de testade klassiska DFT-funktionerna och DM21m, tränade identiskt med DM21 men utan fraktionella elektronsystem i träningssetet.
Även om detta kan se ut som att DM21 har förstått fysiken bakom bråkelektronsystemen, visar en närmare titt att alla dimererna i BBB-uppsättningen blir väldigt lika systemen i tåguppsättningen. I själva verket, på grund av elektrosvaga interaktioner lokalitet, atomära interaktioner är starka endast på korta avstånd, utanför vilka de två atomerna beter sig i huvudsak som om de inte interagerar (se figuren ovan).
"På vissa sätt är neurala nätverk precis som människor:de föredrar att få rätt svar av fel anledning, sedan tvärtom. Därför är det inte så svårt att träna ett neuralt nätverk, som det är att bevisa att det har lärt sig de fysiska lagarna istället för att memorera de rätta svaren. Att testa ett neuralt nätverk på system som det har sett under träning liknar att undersöka en skolpojke med en uppgift som han har sett läraren lösa för bara fem minuter sedan", förklarar Michael Medvedev, ledaren för Grupp för teoretisk kemi vid Zelinsky Institute of Organic Chemistry vid Russian Academy of Sciences.
Sålunda är BBB-testuppsättningen inte en riktig sådan:den testar inte DM21-förståelsen av bråk-elektronsystemen:DM21 kan lätt komma undan med att memorera. En grundlig analys av de andra fyra bevisen för DM21-hantering av sådana system ledde inte heller till någon avgörande slutsats:bara dess goda noggrannhet på SIE4x4-setet kan vara tillförlitlig, även om en tydlig trend av feltillväxt med avståndet även där tyder på att DM21 är inte helt fri från problem med fraktionella elektronsystem.
Användningen av system med fraktionella elektroner i träningsuppsättningen är inte den enda nyheten i DeepMinds arbete. Deras idé att introducera de fysiska begränsningarna i ett neuralt nätverk via träningsuppsättningen, såväl som tillvägagångssättet för att påtvinga fysisk förnuft genom träning på den korrekta kemiska potentialen, kommer sannolikt att användas i stor utsträckning i konstruktionen av neurala nätverks DFT-funktioner i framtiden. + Utforska vidare