Arbetsflödet av djup RL-algoritm för att generera nya SMILES-strängar av föreningar med önskade egenskaper. (A) Träningssteg för den generativa Stack-RNN. (B) Generatorsteg för den generativa Stack-RNN. Under träning, inmatningstoken är ett tecken i den för närvarande bearbetade SMILES-strängen från träningsuppsättningen. Modellen matar ut sannolikhetsvektorn p Θ (a t |s t - 1 ) av nästa tecken med ett prefix. Vektor av parametrar Θ optimeras genom minimering av kors-entropiförlustfunktion. I generatorregimen, inmatningstoken är ett tidigare genererat tecken. Nästa, tecknet at provas slumpmässigt från fördelningen p Θ (vid | s t - 1 ). (C) Allmän rörledning av RL-system för ny föreningsgenerering. (D) Schema för prediktiv modell. Denna modell tar en SMILES-sträng som indata och ger ett reellt tal, vilket är ett uppskattat fastighetsvärde, som en utgång. Modellens parametrar tränas genom minimering av l2-kvadratförlustfunktioner. Kreditera: Vetenskapens framsteg (2018). DOI:10.1126/sciadv.aap7885
En artificiell intelligens skapad vid University of North Carolina vid Chapel Hill Eshelman School of Pharmacy kan lära sig att designa nya läkemedelsmolekyler från grunden och har potentialen att dramatiskt påskynda utformningen av nya läkemedelskandidater.
Systemet kallas Reinforcement Learning for Structural Evolution, känd som ReLeaSE, och är en algoritm och ett datorprogram som består av två neurala nätverk som kan ses som en lärare och en elev. Läraren känner till syntaxen och de språkliga reglerna bakom vokabulären för kemiska strukturer för cirka 1,7 miljoner kända biologiskt aktiva molekyler. Genom att arbeta med läraren, eleven lär sig med tiden och blir bättre på att föreslå molekyler som sannolikt kan vara användbara som nya läkemedel.
Alexander Tropsha, Olexandr Isayev och Mariya Popova, hela UNC Eshelman School of Pharmacy, är skaparna av ReLeaSE. Universitetet har ansökt om patent för tekniken, och teamet publicerade en proof-of-concept studie i tidskriften Vetenskapens framsteg förra veckan.
"Om vi jämför den här processen med att lära oss ett språk, sedan efter att eleven lärt sig det molekylära alfabetet och språkreglerna, de kan skapa nya 'ord, ' eller molekyler, " sa Tropsha. "Om den nya molekylen är realistisk och har den önskade effekten, läraren godkänner. Om inte, läraren ogillar, tvingar studenten att undvika dåliga molekyler och skapa bra."
ReLeaSE är en kraftfull innovation för virtuell screening, den beräkningsmetod som ofta används av läkemedelsindustrin för att identifiera livskraftiga läkemedelskandidater. Virtuell screening gör det möjligt för forskare att utvärdera befintliga stora kemiska bibliotek, men metoden fungerar bara för kända kemikalier. ReLeASE har den unika förmågan att skapa och utvärdera nya molekyler.
"En forskare som använder virtuell screening är som en kund som beställer på en restaurang. Det som kan beställas begränsas vanligtvis av menyn, ", sa Isayev. "Vi vill ge forskare en livsmedelsbutik och en personlig kock som kan skapa vilken rätt de vill."
Teamet har använt ReLeaSE för att generera molekyler med egenskaper som de specificerade, såsom önskad bioaktivitet och säkerhetsprofiler. Teamet använde ReLeaSE-metoden för att designa molekyler med anpassade fysikaliska egenskaper, såsom smältpunkt och löslighet i vatten, och att designa nya föreningar med hämmande aktivitet mot ett enzym som är associerat med leukemi.
"Algorithmens förmåga att designa nya, och därför omedelbart patenterbar, kemiska enheter med specifika biologiska aktiviteter och optimala säkerhetsprofiler bör vara mycket attraktiva för en industri som ständigt söker efter nya tillvägagångssätt för att förkorta tiden det tar att ta med en ny läkemedelskandidat till kliniska prövningar, "sa Tropsha.