Kredit:CC0 Public Domain
1996, när en dator vann en match mot den regerande schackvärldsmästaren Garry Kasparov, det var inget mindre än en sensation. Efter detta genombrott i schackvärlden, brädspelet Go ansågs länge vara en bastion reserverad för mänskliga spelare på grund av dess komplexitet. Men världens bästa spelare kan inte konkurrera med programvaran AlphaGo. Receptet för framgången för detta datorprogram möjliggörs genom en kombination av den så kallade Monte Carlo Tree Search och djupa neurala nätverk baserade på maskininlärning och artificiell intelligens. Ett team av forskare från universitetet i Münster i Tyskland har nu visat att denna kombination är extremt väl lämpad för att planera kemiska synteser – så kallade retrosynteser – med oöverträffad effektivitet. Studien har publicerats i det aktuella numret av Natur .
Marwin Segler, huvudförfattaren till studien, säger, "Retrosyntes är den ultimata disciplinen inom organisk kemi. Kemister behöver år för att bemästra det – precis som med schack eller Go. Förutom rak expertis, du behöver också en bra portion intuition och kreativitet för det. Än så länge, alla antog att datorer inte kunde hänga med utan experter som programmerade i tiotusentals regler för hand. Det vi har visat är att maskinen kan, av sig själv, lär dig reglerna och deras tillämpningar från tillgänglig litteratur."
Retrosyntes är standardmetoden för att designa framställning av kemiska föreningar. Att gå baklänges mentalt, principen är att föreningen bryts ner till allt mindre beståndsdelar tills grundkomponenterna har erhållits. Denna analys ger receptet, som sedan används för att arbeta "framåt" i laboratoriet för att producera målmolekylen, utgående från utgångsmaterialen. Även om det är lätt i teorin, processen medför svårigheter i praktiken. "Precis som i schack, i varje steg eller rörelse, du har många olika möjligheter att välja mellan, " säger Segler. "Inom kemi, dock, det finns storleksordningar fler möjliga drag än i schack, och problemet är mycket mer komplext."
Det är här den nya metoden kommer in i bilden, koppla ihop de djupa neurala nätverken med Monte Carlo Tree Search – en konstellation så lovande att ett stort antal forskare från en mängd olika discipliner arbetar med den. Monte Carlo Tree Search är en metod för att bedöma drag i ett spel. Vid varje drag, datorn simulerar många varianter, till exempel, hur ett parti schack kan sluta. Det mest lovande draget väljs sedan.
På ett liknande sätt, datorn letar nu efter bästa möjliga "moves" för kemisk syntes. Den kan också lära sig genom att använda djupa neurala nätverk. För detta ändamål, datorn bygger på all kemisk litteratur som någonsin publicerats, som beskriver nästan 12 miljoner kemiska reaktioner. Mike Preuss, en informationssystemspecialist och medförfattare till studien, säger, "De djupa neurala nätverken används för att förutsäga vilka reaktioner som är möjliga med en viss molekyl. Med hjälp av Monte Carlo Tree Search, datorn kan testa om de förutspådda reaktionerna verkligen leder till målmolekylen."
Tanken på att använda datorer för att planera synteser är inte ny. "Idén är faktiskt ungefär 60 år gammal." säger Segler. "Folk trodde att det skulle räcka, som i fallet med schack, att ange ett stort antal regler i datorn. Men det gick inte. Kemi är mycket komplext, och i motsats till schack eller Go, det kan inte förstås rent logiskt med enkla regler. Till detta läggs det faktum att antalet publikationer med nya reaktioner fördubblas vart tionde år eller så. Det kan varken kemister eller programmerare hänga med. Vi behöver hjälp av en intelligent dator." Den nya metoden är cirka 30 gånger snabbare än konventionella program för att planera synteser och den hittar potentiella syntesvägar för dubbelt så många molekyler.
I ett dubbelblind AB-test, forskarna från Muenster fann att kemister anser att dessa datorgenererade syntesvägar är lika bra som befintliga beprövade. "Vi hoppas att, med vår metod, kemister kommer inte behöva prova så mycket i labbet, "Segler tillägger, "och det som ett resultat, och använder färre resurser, de kommer att kunna producera de föreningar som gör vår höga levnadsstandard möjlig."