Analysera potentialen hos AlphaFold i läkemedelsupptäckten

Kredit:CC0 Public Domain

Under de senaste decennierna har mycket få nya antibiotika utvecklats, till stor del på grund av att nuvarande metoder för att screena potentiella läkemedel är oöverkomligt dyra och tidskrävande. En lovande ny strategi är att använda beräkningsmodeller, som erbjuder ett potentiellt snabbare och billigare sätt att identifiera nya läkemedel.

En ny studie från MIT avslöjar potentialen och begränsningarna med en sådan beräkningsmetod. Med hjälp av proteinstrukturer genererade av ett artificiell intelligensprogram kallat AlphaFold, undersökte forskarna om befintliga modeller exakt kunde förutsäga interaktionerna mellan bakteriella proteiner och antibakteriella föreningar. Om så är fallet kan forskare börja använda den här typen av modellering för att göra storskaliga skärmar för nya föreningar som riktar sig mot tidigare oriktade proteiner. Detta skulle möjliggöra utvecklingen av antibiotika med verkningsmekanismer utan motstycke, en uppgift som är avgörande för att ta itu med antibiotikaresistenskrisen.

Men forskarna, ledda av James Collins, Termeer-professorn i medicinsk teknik och vetenskap vid MIT:s Institute for Medical Engineering and Science (IMES) och Institutionen för biologisk teknik, fann att dessa befintliga modeller inte fungerade bra för detta ändamål. Faktum är att deras förutsägelser fungerade lite bättre än slumpen.

"Genombrott som AlphaFold utökar möjligheterna för insatser för att upptäcka läkemedel inom silico, men denna utveckling måste kombineras med ytterligare framsteg inom andra aspekter av modellering som är en del av läkemedelsupptäcktssatsningar", säger Collins. "Vår studie talar om både nuvarande förmågor och nuvarande begränsningar för beräkningsplattformar för läkemedelsupptäckt."

I sin nya studie kunde forskarna förbättra prestandan för dessa typer av modeller, kända som molekylära dockningssimuleringar, genom att tillämpa maskininlärningstekniker för att förfina resultaten. Mer förbättring kommer dock att behövas för att fullt ut dra nytta av proteinstrukturerna som tillhandahålls av AlphaFold, säger forskarna.

Collins är seniorförfattaren till studien, som idag publiceras i tidskriften Molecular Systems Biology . MIT postdocs Felix Wong och Aarti Krishnan är huvudförfattarna till uppsatsen.

Molekylära interaktioner

Den nya studien är en del av en satsning som nyligen lanserades av Collins labb kallad Antibiotics-AI Project, som har som mål att använda artificiell intelligens för att upptäcka och designa nya antibiotika.

AlphaFold, en AI-programvara utvecklad av DeepMind och Google, har exakt förutspått proteinstrukturer från deras aminosyrasekvenser. Denna teknik har skapat spänning bland forskare som letar efter nya antibiotika, som hoppas att de skulle kunna använda AlphaFold-strukturerna för att hitta läkemedel som binder till specifika bakterieproteiner.

För att testa genomförbarheten av denna strategi beslutade Collins och hans elever att studera interaktionerna mellan 296 essentiella proteiner från E. coli med 218 antibakteriella föreningar, inklusive antibiotika som tetracykliner.

Forskarna analyserade hur dessa föreningar interagerar med E. coli-proteiner med hjälp av molekylära dockningssimuleringar, som förutsäger hur starkt två molekyler kommer att binda samman baserat på deras former och fysikaliska egenskaper.

Denna typ av simulering har framgångsrikt använts i studier som screenar ett stort antal föreningar mot ett enda proteinmål, för att identifiera föreningar som binder bäst. Men i det här fallet, där forskarna försökte screena många föreningar mot många potentiella mål, visade sig förutsägelserna vara mycket mindre korrekta.

Genom att jämföra förutsägelserna som produceras av modellen med faktiska interaktioner för 12 essentiella proteiner, erhållna från laboratorieexperiment, fann forskarna att modellen hade falska positiva priser som liknar sanna positiva priser. Det tyder på att modellen inte kunde konsekvent identifiera verkliga interaktioner mellan befintliga läkemedel och deras mål.

Med hjälp av en mätning som ofta används för att utvärdera beräkningsmodeller, känd som auROC, fann forskarna också dålig prestanda. "Genom att använda dessa vanliga molekylära dockningssimuleringar fick vi ett auROC-värde på ungefär 0,5, vilket i princip säger att du inte gör något bättre än om du slumpmässigt gissade," säger Collins.

Forskarna hittade liknande resultat när de använde denna modelleringsmetod med proteinstrukturer som har bestämts experimentellt, istället för de strukturer som förutspåtts av AlphaFold.

"AlphaFold verkar fungera ungefär lika bra som experimentellt bestämda strukturer, men vi måste göra ett bättre jobb med molekylära dockningsmodeller om vi ska kunna använda AlphaFold effektivt och omfattande i läkemedelsupptäckten", säger Collins.

Bättre förutsägelser

En möjlig orsak till modellens dåliga prestanda är att proteinstrukturerna som matas in i modellen är statiska, medan proteiner i biologiska system är flexibla och ofta ändrar sina konfigurationer.

För att försöka förbättra framgångsgraden för deras modelleringsmetod körde forskarna prognoserna genom ytterligare fyra maskininlärningsmodeller. Dessa modeller är tränade på data som beskriver hur proteiner och andra molekyler interagerar med varandra, vilket gör att de kan införliva mer information i förutsägelserna.

"Maskininlärningsmodellerna lär sig inte bara formerna, utan också de kemiska och fysikaliska egenskaperna hos de kända interaktionerna, och använder sedan den informationen för att omvärdera dockningsförutsägelserna", säger Wong. "Vi upptäckte att om du skulle filtrera interaktionerna med dessa ytterligare modeller kan du få ett högre förhållande mellan sanna positiva och falska positiva."

Men ytterligare förbättringar behövs fortfarande innan denna typ av modellering kan användas för att framgångsrikt identifiera nya läkemedel, säger forskarna. Ett sätt att göra detta skulle vara att träna modellerna på mer data, inklusive de biofysiska och biokemiska egenskaperna hos proteiner och deras olika konformationer, och hur dessa egenskaper påverkar deras bindning med potentiella läkemedelsföreningar.

Med ytterligare framsteg kan forskare kanske utnyttja kraften i AI-genererade proteinstrukturer för att upptäcka inte bara nya antibiotika utan också läkemedel för att behandla en mängd olika sjukdomar, inklusive cancer, säger Collins. "Vi är optimistiska att med förbättringar av modelleringsmetoderna och utökad datorkraft kommer dessa tekniker att bli allt viktigare i läkemedelsupptäckten", säger han. "Men vi har en lång väg att gå för att uppnå den fulla potentialen av in silico läkemedelsupptäckt." + Utforska vidare

Forskare identifierar nya läkemedel med hjälp av tolkbara förutsägelser om djupinlärning

Nordamerikas sällsynta orm som hittats bita av mer än den kunde tugga

Rootsrock:Schimpanser trummar till sina egna signaturbeats

Biologi

Fyra av fem arter av pinyon-enbär minskar i sina utbredningsområden i väster

"Why Is the Sun So Bright?

Hur parar sig lössar när rovdjur lurar i närheten? Predatorernas inverkan på parning mellan man och kvinna

Vetenskap

Kalkoner 12, 000 år gammal stad på väg att uppslukas

Specialiserade vävtekniker möjliggör en ny värmesköld för planetarisk utforskning

Studien identifierar psykologi av attraktion till religiösa gudar och superhjältar