Kredit:CC0 Public Domain
D. Tyler McQuade, Ph.D., professor vid Virginia Commonwealth University College of Engineering, är huvudutredare för ett multiuniversitetsprojekt som försöker använda artificiell intelligens för att hjälpa forskare att komma på den perfekta molekylen för allt från ett bättre schampo till beläggningar på avancerade mikrochips.
Projektet är ett av de första i USA som valts ut för $994, 433 i finansiering som en del av ett nytt pilotprojekt av National Science Foundation som kallas konvergensacceleratorn (C-Accel). McQuade och hans medarbetare kommer att presentera sin prototyp i mars 2020 i ett bud på ytterligare finansiering på upp till 5 miljoner USD under fem år.
Adam Luxon, en Ph.D. student vid institutionen för kemi- och biovetenskap som har varit med från början, förklarade det så här:"Vi vill i huvudsak göra kemins Alexa."
Precis som Amazon, Google och Netflix använder dataalgoritmer för att föreslå anpassade förutsägelser, teamet planerar att bygga ett öppet nätverk som kan kombinera och hjälpa användare att förstå molekylärvetenskapliga data hämtade från en rad källor inklusive akademin, industri och myndigheter.
Idén är i linje med målet för NSF:s Big Ideas-projekt, "Att utnyttja datarevolutionen, "att engagera forskarsamhället i att utveckla en avancerad cyberinfrastruktur för att påskynda dataintensiv forskning.
Teamet speglar expertis inom flera specialiteter. James K. Ferri arbetar med McQuade, Ph.D., professor vid VCU-avdelningen för kemi- och biovetenskap; Carol A. Parish, Ph.D., professor i kemi och Floyd D. och Elisabeth S. Gottwald ordförande vid Institutionen för kemi vid University of Richmond; och Adrian E. Roitberg, Ph.D., professor vid Institutionen för kemi vid University of Florida. Två företag är också involverade:Two Six Labs, baserad i Arlington, Virginia, och Fathom Information Design, baserat i Boston.
För närvarande, det finns inget delat nätverk eller central portal där molekylärforskare och ingenjörer kan utnyttja artificiell intelligens och datavetenskapliga verktyg för att bygga modeller för att stödja deras behov. Och medan forskare har kunnat skildra vilka element som utgör en molekyl, hur atomerna är ordnade och molekylens egenskaper (som dess smältpunkt), det finns inget standardsätt att representera – eller förutsäga – molekylär prestanda.
Teamet strävar efter att fylla dessa luckor genom att främja konceptet med ett "molekylärt avtryck". Samarbetspartnerna kommer att skapa ett nytt system som representerar molekyler genom att kombinera linjeteckning, geometri och kvantkemiska beräkningar till en enda, maskinlärbart format.
De kommer att utveckla en central plattform för att samla in data, skapa dessa molekylära avtryck och utveckla algoritmer för att bryta data, och kommer att utveckla verktyg för maskininlärning för att skapa prestationsprediktionsmodeller.
"Förmågan att beräkna molekylära egenskaper med hjälp av beräkningstekniker, och att kombinera dessa data med experimentella mätningar, kommer att generera databaser som kommer att producera de mest omfattande resultaten inom molekylär vetenskap, sa Parish.
"Det finns många laboratorier runt om i världen som arbetar i detta utrymme, men, det finns få organisatoriska strukturer tillgängliga som uppmuntrar öppen delning av dessa data till gagn för samhället och det gemensamma bästa, " Parish adderade. "Vi försöker samarbeta med andra för att tillhandahålla denna struktur; ett öppet kunskapsnätverk eller arkiv där forskare kan deponera sina experimentella och beräkningsdata på molekylär nivå i utbyte mot användarvänliga verktyg för att hjälpa till att hantera och fråga efter data."
Den första responsen på deras idé har varit stark från potentiella partners. Ferri och de andra har redan samlat in mer än ett dussin brev från stora företag som Dow och Merck som uttrycker intresse för att delta.
McQuade sa kemiingenjörer i stora industrier, inklusive konsumentprodukter och olje- och gasproducenter, lägga ner mycket möda på att köra experiment för att bestämma vilken molekyl de vill använda, som att hitta den bästa schampotillsatsen som inte får bebisar att gråta.
"Förmågan att designa de egenskaper du vill är fortfarande mer konst än vetenskap, " han sa.
Teamet planerar också att utveckla en verktygslåda för att bearbeta och visualisera data.
Rötberg, vars forskningsfokus inkluderar avancerad visualisering, sa att detta kan ta formen av en virtuell verklighet där en användare kan hitta material som är lösligt i vatten men inte olja, till exempel, och sedan kunna söka efter liknande material i närheten.
"Vi föreställer oss en mycket interaktiv plattform där användaren kan utforska relationer mellan data och önskade materialegenskaper, " han sa.