Kredit:CC0 Public Domain
Nästa generations sekvenseringsteknik har inlett en ny era inom medicin, vilket gör det lättare att identifiera en sekvens av nukleotider i DNA eller en sekvens av aminosyror i en specifik individs proteiner och använda denna information för diagnos och behandling. Små förändringar i dessa sekvenser kan tyda på en mindre störning, och ibland en allvarlig sjukdom.
Forskare från Skoltech, Münchens tekniska universitet, St. Petersburg Polytechnic University och Indian Institute of Technology Madras (Chennai, Indien) har utvecklat en maskininlärningsbaserad metod för att analysera proteiners atomära strukturer och förutsäga patogeniciteten hos mutationer. Metoden är anpassad för transmembranproteiner som står för 25 till 30 procent av alla proteiner i en cell, och fungerar ofta som måltavlor för droger.
"I den här studien, vi använde en kombination av 1-D-information om proteiners aminosyrasekvenser och 3-D-information om proteinets atomstrukturer för att skapa en effektiv maskininlärningsbaserad modell som hjälper till att identifiera sjukdomsassocierade aminosyrasubstitutioner i membranproteiner, " säger studiens första författare och biträdande professor vid Skoltech, Petr Popov.