En iterativ, flerstegsprocess för att träna ett neuralt nätverk, som visas uppe till vänster, leder till en bedömning av avvägningarna mellan två konkurrerande egenskaper, som visas i grafen i mitten. Den blå linjen representerar en så kallad Pareto-front, definiera de fall utöver vilka materialvalet inte kan förbättras ytterligare. Detta gör det möjligt att identifiera specifika kategorier av lovande nya material, som den som avbildas av molekyldiagrammet till höger. Kredit:Massachusetts Institute of Technology
När du söker igenom teoretiska listor över möjliga nya material för särskilda applikationer, som batterier eller andra energirelaterade enheter, det finns ofta miljontals potentiella material som kan övervägas, och flera kriterier som måste uppfyllas och optimeras samtidigt. Nu, forskare vid MIT har hittat ett sätt att dramatiskt effektivisera upptäcktsprocessen, med hjälp av ett maskininlärningssystem.
Som en demonstration, teamet kom fram till en uppsättning av de åtta mest lovande materialen, av nästan 3 miljoner kandidater, för ett energilagringssystem som kallas ett flödesbatteri. Denna slaktprocess skulle ha tagit 50 år med konventionella analysmetoder, de säger, men de åstadkom det på fem veckor.
Fynden redovisas i tidskriften ACS Central Science , i en artikel av MIT professorn i kemiteknik Heather Kulik, Jon Paul Janet Ph.D. '19, Sahasrajit Ramesh, och doktorand Chenru Duan.
Studien tittade på en uppsättning material som kallas övergångsmetallkomplex. Dessa kan finnas i ett stort antal olika former, och Kulik säger att de "är riktigt fascinerande, funktionella material som skiljer sig från många andra materialfaser. Det enda sättet att förstå varför de fungerar som de gör är att studera dem med hjälp av kvantmekanik."
Att förutsäga egenskaperna hos något av miljontals av dessa material skulle kräva antingen tidskrävande och resurskrävande spektroskopi och annat labbarbete, eller tidskrävande, mycket komplex fysikbaserad datormodellering för varje möjligt kandidatmaterial eller kombination av material. Varje sådan studie kan ta timmar till dagars arbete.
Istället, Kulik och hennes team tog ett litet antal olika möjliga material och använde dem för att lära ut ett avancerat maskinlärande neuralt nätverk om förhållandet mellan materialens kemiska sammansättning och deras fysikaliska egenskaper. Den kunskapen användes sedan för att generera förslag på nästa generation av möjliga material som skulle användas för nästa omgång av träning av det neurala nätverket. Genom fyra på varandra följande iterationer av denna process, det neurala nätverket förbättrades avsevärt varje gång, tills de nådde en punkt där det stod klart att ytterligare iterationer inte skulle ge några ytterligare förbättringar.
Detta iterativa optimeringssystem effektiviserade i hög grad processen för att komma fram till potentiella lösningar som uppfyllde de två motstridiga kriterierna som eftersträvas. Den här typen av process att hitta de bästa lösningarna i situationer, där förbättring av en faktor tenderar att förvärra den andra, är känd som en Pareto-front, representerar en graf över punkterna så att varje ytterligare förbättring av en faktor skulle göra den andra värre. Med andra ord, grafen representerar bästa möjliga kompromisspunkter, beroende på den relativa betydelse som tilldelas varje faktor.
Att träna typiska neurala nätverk kräver mycket stora datamängder, allt från tusentals till miljontals exempel, men Kulik och hennes team kunde använda denna iterativa process, baserad på Pareto frontmodell, för att effektivisera processen och ge tillförlitliga resultat med bara några hundra prover.
När det gäller screening för flödesbatterimaterial, de önskade egenskaperna var i konflikt, som ofta är fallet:Det optimala materialet skulle ha hög löslighet och hög energitäthet (förmågan att lagra energi för en given vikt). Men ökad löslighet tenderar att minska energitätheten, och vice versa.
Inte bara kunde det neurala nätverket snabbt komma med lovande kandidater, den kunde också tilldela nivåer av förtroende till sina olika förutsägelser genom varje iteration, vilket hjälpte till att förfina urvalet i varje steg. "Vi utvecklade en bättre än klassens bästa osäkerhetskvantifieringsteknik för att verkligen veta när dessa modeller skulle misslyckas, " säger Kulik.
Utmaningen de valde för proof-of-concept-försöket var material för användning i redoxflödesbatterier, en typ av batteri som lovar stora, batterier i nätskala som kan spela en betydande roll för att möjliggöra rena, förnybar energi. Övergångsmetallkomplex är den föredragna kategorin av material för sådana batterier, Kulik säger, men det finns för många möjligheter att utvärdera på konventionellt sätt. De började med en lista på 3 miljoner sådana komplex innan de slutligen sänkte det till de åtta bra kandidaterna, tillsammans med en uppsättning designregler som ska göra det möjligt för experimentalister att utforska potentialen hos dessa kandidater och deras variationer.
"Genom den processen, det neurala nätet blir både allt smartare när det gäller [design] utrymmet, men också allt mer pessimistisk att allt utöver vad vi redan har karakteriserat kan ytterligare förbättra det vi redan vet, " hon säger.
Förutom de specifika övergångsmetallkomplex som föreslås för ytterligare undersökning med detta system, hon säger, själva metoden skulle kunna ha mycket bredare tillämpningar. "Vi ser det som ramverket som kan tillämpas på alla materialdesignutmaningar där du verkligen försöker ta itu med flera mål samtidigt. Du vet, alla de mest intressanta utmaningarna för materialdesign är sådana där du har en sak du försöker förbättra, men att förbättra det förvärrar en annan. Och för oss, redoxflödesbatteriets redoxpar var bara en bra demonstration av vart vi tror att vi kan gå med denna maskininlärning och accelererade materialupptäckt."
Till exempel, att optimera katalysatorer för olika kemiska och industriella processer är en annan typ av komplex materialsökning, säger Kulik. För närvarande använda katalysatorer innefattar ofta sällsynta och dyra grundämnen, så att hitta liknande effektiva föreningar baserade på rikliga och billiga material kan vara en betydande fördel.
"Denna tidning representerar, Jag tror, den första tillämpningen av multidimensionell riktad förbättring inom de kemiska vetenskaperna, " säger hon. Men den långsiktiga betydelsen av arbetet ligger i själva metodiken, på grund av saker som kanske inte alls är möjliga annars. "Du börjar inse att även med parallella beräkningar, det här är fall där vi inte skulle ha kommit på en designprincip på något annat sätt. Och dessa ledtrådar som kommer ut ur vårt arbete, dessa är inte nödvändigtvis alls idéer som redan var kända från litteraturen eller som en expert skulle ha kunnat peka dig på."
"Detta är en vacker kombination av begrepp inom statistik, tillämpad matematik, och fysisk vetenskap som kommer att vara extremt användbar i tekniska tillämpningar, " säger George Schatz, en professor i kemi och i kemi och biologisk teknik vid Northwestern University, som inte var förknippad med detta arbete. He says this research addresses "how to do machine learning when there are multiple objectives. Kulik's approach uses leading edge methods to train an artificial neural network that is used to predict which combination of transition metal ions and organic ligands will be best for redox flow battery electrolytes."
Schatz says, "This method can be used in many different contexts, so it has the potential to transform machine learning, which is a major activity around the world."
Den här historien återpubliceras med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som täcker nyheter om MIT-forskning, innovation och undervisning.