Cecilia Clementi. Upphovsman:Jeff Fitlow/Rice University
Beräkningsmodeller har kommit långt i sin förmåga att simulera de mest grundläggande biologiska processerna, till exempel hur proteiner viks. En ny teknik skapad av forskare från Rice University bör göra det möjligt för forskare att modellera större molekyler med större noggrannhet än någonsin.
Rice lab för beräkningskemisten Cecilia Clementi har utvecklat ett molekylärt modelleringsramverk som mer exakt kan återge experimentella resultat med enkla grovkorniga modeller som används för att simulera proteindynamik.
Ramverket, Observerbar driven design av effektiva molekylära modeller (ODEM), innehåller tillgängliga experimentella data i definitionen av en grovkornig simuleringsmodell. För en given grovkornig modell, upprepa simuleringen med inkrementella förändringar i modellparametrarna förbättrar algoritmens förmåga att förutsäga, till exempel, hur ett protein kommer att hitta sin funktionella form.
Arbetet som leds av Clementi och Rice doktorand och huvudförfattare Justin Chen förekommer i American Chemical Society's Journal of Chemical Theory and Computation .
"Förstå proteiner, särskilt deras dynamik, är viktigt för att förstå livet, "Sade Clementi." Det finns två kompletterande sätt att göra detta:antingen genom simulering eller experiment. I ett experiment, du mäter något som är verkligt, men du är väldigt begränsad i de mängder du kan mäta direkt. Det är som att sätta ihop ett pussel med bara några få bitar. "
Hon sa att simuleringar tillåter forskare att titta på alla aspekter av proteindynamik, men modeller som innehåller egenskaperna för varje atom kan ta superdatorer månader eller år att beräkna, även om proteinerna själva viker sig i sekunder in vivo. För snabbare resultat, forskare använder ofta grovkorniga modeller, förenklade simuleringar där några effektiva "pärlor" representerar grupper av atomer i ett protein.
"I mycket enkla modeller måste du göra starka approximationer, och som en konsekvens, resultaten kan skilja sig från verkligheten, "Clementi sa." Vi kombinerar dessa två tillvägagångssätt och använder simuleringskraften på ett sätt som reproducerar experimenten. På det sättet, vi får det bästa av två världar. "
Att skaffa inledande data är inte ett problem, Sa Chen. "Det finns redan en mängd experimentella data om proteiner, så det är inte svårt att hitta, "sa han." Det är bara att hitta ett sätt att modellera data i en simulering. "
Clementi sa att data kan komma från vilken som helst eller en kombination av källor som Förster resonance energy transfer (FRET), mutagenes eller kärnmagnetisk resonans. Beräkningsramen drar fördel av Markov -modeller för att kombinera flera korta proteinsimuleringar för att erhålla jämviktsfördelningen av proteinkonfigurationer som används i ODEM. "Markov -modeller låter oss kombinera och utforska olika delar av ett proteins konfigurationsutrymme, "sa hon." Det är ett smart sätt att dela och erövra. "
Nyckeln, enligt forskarna, är att bara inkludera så mycket fysisk detalj som krävs för att modellera processen exakt.
"Det finns modeller som är mycket exakta, men de är beräknat för dyra, "Sa Clementi." Det finns för mycket information i dessa modeller, så du vet inte vad som är de viktigaste fysiska ingredienserna.
"I våra förenklade modeller, vi inkluderar bara de fysiska faktorer som vi tycker är viktiga, "sa hon." Om simuleringarna genom att använda ODEM förbättrar deras överensstämmelse med experiment, det betyder att hypotesen var korrekt. Om de inte gör det, då vet vi att det saknas ingredienser. "
Forskarna fann att deras teknik kan avslöja oväntade molekylära egenskaper. I processen med att testa deras algoritm, forskarna upptäckte en ny detalj om vikmekanismen för FiP35, ett vanligt WW -domänprotein som är en bit av större signal- och strukturproteiner. FiP35, med bara 35 aminosyror, är väl förstådd och används ofta i vikningsstudier.
ODEM -modellen för FiP35, baserat på experimentella data från simulerade FRET -resultat, avslöjade flera regioner där lokaliserad frustration tvingade fram förändringar i vikningsprocessen. Deras analys visade att interaktionerna är viktiga för processen och sannolikt evolutionärt bevarade, men de sa att data som leder till den slutsatsen aldrig skulle ha dykt upp om de simulerade FRET-data inte användes i den grovkorniga modellen.
"Nu skalar vi upp det till större system, som 400 rester av proteiner, cirka 10 gånger större än vårt testprotein, "Sa Chen." Du kan inte göra full-atom-simuleringar av dessa stora rörelser och långa tidsskalor, men om du gör 10 eller 11 iterationer av en grovkornig modell med ODEM, de tar bara några timmar. Det är en enorm minskning av den tid det skulle ta en person att se rimliga resultat. "