UConn-forskning var omslagsberättelsen i en ny upplaga av tidskriften CrystEngComm . Kredit:University of Connecticut
Att förvandla ett nytt läkemedel från en uppsättning flytande ingredienser i ett labb till ett piller i en låda kan vara en övning i komplex kemi. För att bättre förstå hur läkemedelsingredienser kristalliserar, UConn-forskare bröt en stor samling experimentella data från Pfizer. De rapporterade sina fynd i tidskriftens omslagsberättelse den 28 februari CrystEngComm .
Många läkemedel tas i fast kristallin form som piller. Men att komma på det bästa sättet att få en drog till fast form är ett knepigt problem. Det finns många olika lösningsmedel som läkemedelsingredienser kan lösas i, och många olika procedurer som kan få läkemedlet att kristallisera. Bearbetningsvillkor, som temperatur och tryck, kan också ha en djupgående effekt. Det finns så många olika variabler – saker som kan förändra resultatet – involverade att maskininlärning kan vara det bästa sättet att attackera ett så komplicerat problem.
Pfizer bildade ett samarbete med UConns materialforskare Serge Nakhmanson och hans kollegor på Institutionen för materialvetenskap och teknik för att utvärdera maskininlärningsmetoder för deras användbarhet. Data mining, de hoppades, kan hjälpa till att ta reda på det bästa sättet att få en farmaceutisk förening att kristallisera. Med hjälp av Pfizers data och relevant expertis, UConns materialteam testade tre olika datoralgoritmer. Algoritmerna kallas för maskininlärning eftersom datorn använder dem för att bygga matematiska modeller av data, hitta mönster, och sedan "lära" av dessa mönster för att göra korrekta förutsägelser.
Nakhmansons doktorand, Ayana Ghosh, fann att algoritmen Random Forest Regression (RFR) gav de mest exakta kristallisationsförutsägelserna. Dessutom, RFR var den enda som kunde identifiera egenskaper som skulle göra farmaceutiska molekyler lättare att kristallisera; till exempel, om en molekyl väger mindre än X mängd och har ett visst antal vätebindningar, sannolikheten att den framgångsrikt kan kristalliseras ökar.
"Det här är precis den typ av information som en syntetisk kemist skulle behöva för att bestämma hur man gör ett nytt läkemedel i form av ett piller, " säger Nakhmanson. "RFR-maskininlärningstekniken är verkligen användbar för att ta itu med vilka parametrar som är viktiga för kristallisering och vilka som inte är det."