Maskininlärningsbaserad analys av signalvägarna som finns i aminosyror som finns i humana proteiner. Upphovsman:Navli Duro/University of South Florida
Maskininlärningsalgoritmer utmärker sig för att hitta komplexa mönster inom big data, så forskare använder dem ofta för att göra förutsägelser. Forskare driver denna framväxande teknik bortom att hitta korrelationer för att hjälpa till att avslöja dolda orsak-effekt-relationer och driva vetenskapliga upptäckter.
Vid University of South Florida, forskare integrerar maskininlärningstekniker i sitt arbete med att studera proteiner. När de rapporterar in Journal of Chemical Physics , en av deras främsta utmaningar har varit brist på metoder för att identifiera orsak-effekt-samband i data som erhållits från molekylära dynamiksimuleringar.
"Proteiner kan ses som nanoskopiska maskiner som utför en uppsättning uppgifter. Men när och där proteiner utför sina specifika uppgifter styrs av celler genom olika stimuli, såsom små molekyler, "sade Sameer Varma, docent i biofysik vid USF. "Dessa stimuli interagerar med proteiner för att slå dem på och av, 'och kan till och med ändra deras hastigheter och styrkor. "
I de flesta proteiner, de biologiska stimuli interagerar med en plats på proteinet som är relativt långt ifrån den del som utför sin motsvarande uppgift, kräver en signalväg. "Det här fjärrstyrda sättet att byta in proteiner är känt som" allosterisk signalering ". Många proteiner av farmaceutisk betydelse har nu identifierats där det är känt att dynamiken eller '' jiggling and wiggling '' av deras beståndsdelar är avgörande för allosterisk signalering, "Varma sa." Detaljerna, dock, förbli skissartad. "
Varma och kollegor tror att maskininlärningsmetoder kan göra skillnad. "Att utveckla och använda maskininlärningstekniker gör det möjligt för oss att hitta orsak-effekt-samband i proteindynamikdata och äntligen börja ta itu med några av de mycket grundläggande frågorna inom proteintillverkning, "sa han." Ett av våra nyckelfynd var att signalen som initierades vid stimuleringsstället för proteinet tycktes försvagas när det flyttade sig bort från stimuleringsstället. Det kom som en överraskning, eftersom inget avståndsberoende observerades för kopplingen av termiska rörelser mellan proteinställen. "
Gruppens arbete visar hur metoder för maskininlärning kan användas för att identifiera samband mellan orsak och verkan inom data. Utöver detta, "dessa tekniker gör att vi kan stoppa kritiska luckor i proteintillverkning, "Sa Varma." I slutändan, när våra metoder tillämpas på de många proteinerna av farmaceutiskt intresse, vi förväntar oss att de mekanistiska detaljerna avslöjar välbehövliga nya interventionsstrategier för att återställa proteinaktiviteter i sjuka tillstånd. De allmänna biofysiska insikter vi får bör också bidra till att inspirera till nya biomimetiska lösningar för många nanoingenjörsproblem, såsom nanosensordesign för riktad läkemedelsleverans. "
Forskarna ser för sig spännande nytt arbete som kommer att växa från deras senaste fynd. "Än så länge, vi har fokuserat på jämviktsdata, men signalprocessen har en kritisk icke -jämviktskomponent som vi inte har undersökt ännu, "Varma sa. Gruppen planerar också att utforska de omgivande vattenens roll för att signalera mer detaljerat, samt tillämpa sina maskininlärningstekniker på en bred uppsättning proteinfamiljer för att avgöra i vilken utsträckning deras nya biofysiska fynd är generaliserbara.