Kredit:CC0 Public Domain
Forskare vid Stanford har skapat en algoritm som styrs av tidigare forskning, lägger ut de DNA-sekvenser som mest sannolikt kommer att överensstämma med antimikrobiella egenskaper.
När hotet om antibiotikaresistens skymtar, Mikrobiologer är inte de enda som tänker på nya lösningar. James Zou, Ph.D., biträdande professor i biomedicinsk datavetenskap vid Stanford, har tillämpat maskininlärning för att skapa en algoritm som genererar tusentals helt nya virtuella DNA-sekvenser med avsikten att en dag skapa antimikrobiella proteiner.
Algoritmen, kallas Feedback GAN, fungerar i huvudsak som en massproducent av olika DNA-fragment. Och även om dessa sekvensförsök är något slumpmässiga, Algoritmen fungerar inte i blindo. Det bygger de nya möjliga peptiderna, eller små grupper av aminosyror, på tidigare forskning som lägger ut de DNA-sekvenser som mest sannolikt kommer att överensstämma med antimikrobiella egenskaper.
Tills vidare, dessa mallar, som inte finns i naturen, är teoretiska, skapas på en dator. Men inför stigande oro för mikroberresistens, Zou sa att det är viktigt att tänka på lösningar som inte redan finns.
"Vi valde att sträva efter antimikrobiella proteiner eftersom det är ett mycket viktigt, problem med hög effekt som också är ett relativt löst problem för algoritmen, ", sa Zou. "Det finns befintliga verktyg som vi införlivar i vårt system som utvärderar om en ny sekvens sannolikt har egenskaperna hos ett framgångsrikt antimikrobiellt protein."
Feedback GAN bygger på det, arbetar för att införliva precis rätt balans mellan slumpmässig slump och precision.
En artikel som beskriver algoritmen publicerades online den 11 februari Naturens maskininlärning . Anvita Gupta, en student i datavetenskap, är den första författaren; Zou är senior författare.
Självförfinande
Gupta och Zous algoritm tar inte bara fram nya kombinationer av DNA. Den förfinar sig också aktivt, lära sig vad som fungerar och vad som inte fungerar genom en återkopplingsslinga:Efter att algoritmen spottar ut ett brett spektrum av DNA-sekvenser, den kör en trial-and-error-inlärningsprocess som sållar igenom peptidförslagen. Baserat på deras likhet med andra kända antimikrobiella peptider, de "bra" matas tillbaka in i algoritmen för att informera framtida DNA-sekvenser som genereras från koden, och att själva bli förfinade.
"Det finns en inbyggd domare och, genom att ha denna feedback loop, systemet lär sig att modellera nygenererade sekvenser efter de som bedöms sannolikt ha antimikrobiella egenskaper, "Sa Zou. "Så tanken är att både individuella peptidsekvenser och genereringen av sekvenserna blir bättre och bättre."
Zou har också övervägt en annan kärnkomponent i hypotetiska proteiner:proteinveckning. Proteiner förvrängs till mycket specifika strukturer kopplade till deras funktioner. En algoritm kan skapa den perfekta sekvensen, men om den inte kan vikas ihop, det är värdelöst — som kuggarna på en klocka som är strödd på ett bord.
Zou kan justera algoritmen så att istället för att analysera en benägenhet för antimikrobiella egenskaper, det avgör sannolikheten för korrekt vikning.
"Vi kan faktiskt göra de här två sakerna parallellt där vi tittar på antimikrobiella egenskaper hos en sekvens och sannolikheten för att vika en annan, " sa Zou. "Vi kör båda så att vi optimerar antingen de antimikrobiella egenskaperna eller dess förmåga att vika sig."
Nästa, Zou hoppas kunna slå samman de två varianterna av algoritmen för att skapa peptidsekvenser som är optimerade för både deras mikrobdödande förmåga och deras förmåga att vikas till ett äkta protein.