Kredit:CC0 Public Domain
Två beräkningsforskare vid Freie Universität Berlin förändrar hur stora proteiner modelleras inuti datorer genom att kombinera maskininlärning, ett område av artificiell intelligens, med statistisk fysik. Fynden publicerades i Proceedings of the National Academy of Science .
"Även om biologiska molekyler som proteiner är för små för att se med blotta ögat, de består av ett stort antal atomer, säger doktor Simon Olsson, Alexander von Humboldt-stipendiat och huvudförfattare på studien. "Detta gör det tekniskt utmanande att studera dem i den utsträckning som krävs för att förstå hur de fungerar." Att få insikter i hur proteiner fungerar är avgörande för flera biomedicinska och biotekniska tillämpningar, inklusive förbättrad global livsmedelssäkerhet, växtskydd och bekämpa uppkomsten av multiresistenta patogener.
I deras artikel, författarna beskriver en procedur för att övervinna de tekniska utmaningarna med att simulera stora proteiner. Den viktigaste insikten är att inse att proteiner är som sociala nätverk. Dr Frank Noé, professor vid Freie Universität Berlin, säger, "Proteiner är kända för att vara sammansatta av flera mindre byggstenar - rätt sammansättning av dessa leder till uppkomsten av biologiska funktioner som vi känner det."
Traditionellt, proteiner betraktas som en helhet när de simuleras inuti en dator, eftersom det är så de observeras i experiment. Dock, deras byggstenar är små molekylära switchar, som var och en spontant kan växla mellan flera tillstånd. Att förstå detta växlingsbeteende är viktigt för att förstå hur funktion uppstår, och därför, också viktigt för applikationer.
"Problemet är egentligen att vi aldrig kommer att kunna simulera alla möjliga konfigurationer av dessa switchar, " säger doktor Simon Olsson. "Det finns alldeles för många av dem, de växer exponentiellt snabbt. Säg att en switch har två tillstånd, två omkopplare kan vara i fyra inställningar, tre omkopplare i åtta. När du har 200 switchar, antalet inställningar är lika med antalet atomer i det kända universum."
Att omformulera simuleringarna för att använda de lokala byggstenarna och lära sig hur de är kopplade bryter denna ogynnsamma skalning och gör stora proteinsimuleringar möjliga. Detta lärande görs med metoder för modern artificiell intelligens (AI). Simon Olsson förklarar, "Även om det verkar mer komplicerat att modellera många byggstenar snarare än bara ett enda konfigurationstillstånd, det visar sig att vi kan använda idéer från AI för att få datorer att lära sig ett "socialt nätverk" av byggstenarna och använda detta för att förstå deras beteende."
Att känna till detta sociala nätverk av proteinbyggstenarna visar sig ha flera fördelar. Dr Frank Noé förklarar, "Att fastställa detta nätverk kräver inte att vi ser alla möjliga konfigurationer av molekylsystemet, men när vi väl har nätverket kan vi karakterisera dem!" Det sociala proteinnätverket destillerar det väsentliga om hur proteiner fungerar, och gör därigenom betydande framsteg mot att få ner det beräkningsfotavtryck som bestämmer proteinfunktionen.