• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Kemi
    Maskininlärning upptäcker nya sekvenser för att öka läkemedelsleveransen

    MIT-forskare kombinerade experimentell kemi med artificiell intelligens för att upptäcka giftfria, mycket aktiva peptider som kan bindas till fosfordiamidatmorfolinooligomerer (PMO) för att underlätta läkemedelsleverans. Genom att utveckla dessa nya sekvenser, forskare hoppas snabbt kunna påskynda utvecklingen av genterapier för Duchenne muskeldystrofi och andra sjukdomar. Upphovsman:Massachusetts Institute of Technology

    Duchennes muskeldystrofi (DMD), en sällsynt genetisk sjukdom som vanligtvis diagnostiseras hos unga pojkar, gradvis försvagar musklerna i hela kroppen tills hjärtat eller lungorna sviker. Symtomen dyker ofta upp vid 5 års ålder; allt eftersom sjukdomen fortskrider, patienter förlorar förmågan att gå runt 12 års ålder. Idag, medellivslängden för DMD-patienter ligger runt 26.

    Det var stora nyheter, sedan, när Cambridge, Massachusetts-baserade Sarepta Therapeutics tillkännagav 2019 ett banbrytande läkemedel som direkt riktar sig mot den muterade genen som är ansvarig för DMD. Behandlingen använder antisense fosforodiamidatmorfolinooligomerer (PMO), en stor syntetisk molekyl som tränger igenom cellkärnan för att modifiera dystrofingenen, möjliggör produktion av ett nyckelprotein som normalt saknas hos DMD-patienter. "Men det finns ett problem med PMO i sig. Det är inte särskilt bra på att komma in i celler, säger Carly Schissel, en Ph.D. kandidat vid MIT:s kemiska institution.

    För att öka leveransen till kärnan, forskare kan fästa cellpenetrerande peptider (CPP) på läkemedlet, därigenom hjälper den att passera cellen och kärnmembranen för att nå sitt mål. Vilken peptidsekvens är bäst för jobbet, dock, har förblivit en hotande fråga.

    MIT-forskare har nu utvecklat ett systematiskt tillvägagångssätt för att lösa detta problem genom att kombinera experimentell kemi med artificiell intelligens för att upptäcka giftfria, mycket aktiva peptider som kan bindas till PMO för att underlätta leverans. Genom att utveckla dessa nya sekvenser, de hoppas att snabbt kunna påskynda utvecklingen av genterapier för DMD och andra sjukdomar.

    Resultaten av deras studie har nu publicerats i tidskriften Naturkemi i en tidning ledd av Schissel och Somesh Mohapatra, en Ph.D. student vid MIT Institutionen för materialvetenskap och teknik, vilka är huvudförfattarna. Rafael Gomez-Bombarelli, biträdande professor i materialvetenskap och teknik, och Bradley Pentelute, professor i kemi, är tidningens seniorförfattare. Andra författare inkluderar Justin Wolfe, Colin Fadzen, Kamela Bellovoda, Chia-Ling Wu, Jenna Wood, Annika Malmberg, och Andrei Loas.

    "Att föreslå nya peptider med en dator är inte särskilt svårt. Att bedöma om de är bra eller inte, det är det här som är svårt, " säger Gomez-Bombarelli. "Den viktigaste innovationen är att använda maskininlärning för att koppla samman sekvensen av en peptid, särskilt en peptid som inkluderar icke-naturliga aminosyror, till experimentellt uppmätt biologisk aktivitet."

    Drömdata

    CPP är relativt korta kedjor, består av mellan fem och 20 aminosyror. Även om en CPP kan ha en positiv inverkan på läkemedelsleveransen, flera sammanlänkade har en synergistisk effekt när det gäller att bära droger över mållinjen. Dessa längre kedjor, som innehåller 30 till 80 aminosyror, kallas miniproteiner.

    Innan en modell kunde göra värdefulla förutsägelser, forskare på den experimentella sidan behövde skapa en robust datauppsättning. Genom att blanda och matcha 57 olika peptider, Schissel och hennes kollegor kunde bygga ett bibliotek med 600 miniproteiner, var och en kopplad till PMO. Med en analys, laget kunde kvantifiera hur väl varje miniprotein kunde flytta sin last över cellen.

    Beslutet att testa aktiviteten för varje sekvens, med PMO redan ansluten, var viktigt. Eftersom ett givet läkemedel sannolikt kommer att förändra aktiviteten hos en CPP-sekvens, det är svårt att återanvända befintliga data, och data som genereras i ett enda labb, på samma maskiner, av samma personer, uppfyller en guldstandard för konsekvens i datauppsättningar för maskininlärning.

    Ett mål med projektet var att skapa en modell som kunde fungera med vilken aminosyra som helst. Medan endast 20 aminosyror förekommer naturligt i människokroppen, hundratals fler existerar någon annanstans - som ett aminosyrautvidgningspaket för läkemedelsutveckling. För att representera dem i en maskininlärningsmodell, forskare använder vanligtvis one-hot encoding, en metod som tilldelar varje komponent till en serie binära variabler. Tre aminosyror, till exempel, skulle representeras som 100, 010, och 001. För att tillsätta nya aminosyror, antalet variabler skulle behöva öka, vilket innebär att forskare skulle ha fastnat och behöva bygga om sin modell med varje tillägg.

    Istället, teamet valde att representera aminosyror med topologiska fingeravtryck, vilket i huvudsak skapar en unik streckkod för varje sekvens, där varje rad i streckkoden anger antingen närvaron eller frånvaron av en viss molekylär understruktur. "Även om modellen inte har sett [en sekvens] tidigare, vi kan representera det som en streckkod, som överensstämmer med de regler som modellen har sett, säger Mohapatra, som ledde utvecklingsinsatser för projektet. Genom att använda detta representationssystem, forskarna kunde utöka sin verktygslåda med möjliga sekvenser.

    Teamet utbildade ett konvolutionellt neuralt nätverk på miniproteinbiblioteket, med var och en av de 600 miniproteinerna märkta med dess aktivitet, indikerar dess förmåga att tränga igenom cellen. Tidigt på, modellen föreslog miniproteiner laddade med arginin, en aminosyra som sliter hål i cellmembranet, vilket inte är idealiskt för att hålla celler vid liv. För att lösa detta problem, forskare använde en optimerare för att decentivera arginin, hålla modellen från fusk.

    I slutet, förmågan att tolka förutsägelser som föreslagits av modellen var nyckeln. "Det räcker vanligtvis inte att ha en svart låda, eftersom modellerna kan fixera på något som inte är korrekt, eller för att det kan utnyttja ett fenomen på ett ofullkomligt sätt, " säger Gomez-Bombarelli.

    I detta fall, forskare kan överlappa förutsägelser som genereras av modellen med streckkoden som representerar sekvensstrukturen. "Att göra det belyser vissa regioner som modellen tycker spelar den största rollen för hög aktivitet, " säger Schissel. "Det är inte perfekt, men det ger dig fokuserade regioner att leka med. Den informationen skulle definitivt hjälpa oss i framtiden att designa nya sekvenser empiriskt. "

    Leveranshöjning

    I sista hand, the machine-learning model proposed sequences that were more effective than any previously known variant. One in particular can boost PMO delivery by 50-fold. By injecting mice with these computer-suggested sequences, the researchers validated their predictions and demonstrated that the miniproteins are nontoxic.

    It is too early to tell how this work will affect patients down the line, but better PMO delivery will be beneficial in several ways. If patients are exposed to lower levels of the drug, they may experience fewer side effects, till exempel, or require less-frequent doses (PMO is administered intravenously, often on a weekly basis). The treatment may also become less costly. As a testament to the concept, recent clinical trials demonstrated that a proprietary CPP from Sarepta Therapeutics could decrease exposure to PMO by 10-fold. Också, PMO is not the only drug that stands to be improved by miniproteins. In additional experiments, the model-generated miniproteins carried other functional proteins into the cell.

    Noticing a disconnect between the work of machine-learning researchers and experimental chemists, Mohapatra has posted the model on GitHub, along with a tutorial for experimentalists who have their own list of sequences and activities. He notes that over a dozen people from across the world have adopted the model so far, repurposing it to make their own powerful predictions for a wide range of drugs.

    Den här historien återpubliceras med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som täcker nyheter om MIT-forskning, innovation och undervisning.




    © Vetenskap https://sv.scienceaq.com