Kredit:CC0 Public Domain
Forskare har utvecklat en process som kraftigt kan minska arbetet med beräkningsproteindesign, enligt en studie i Proceedings of the National Academy of Sciences .
Tekniken använder 3-D strukturella modeller för att projicera hur nya kombinationer av molekylära block kan fungera tillsammans för att uppnå en önskad effekt.
Framsteg, som fokuserar på ett relativt litet antal proteinsubstrukturer snarare än det oändliga antalet kombinationer på atomnivå, skulle kunna underlätta utvecklingen av nya mediciner och material.
"När du designar en byggnad, du behöver inte nödvändigtvis förstå hur sandkorn interagerar med varandra inom en tegelsten, sade Gevorg Grigoryan, en docent i datavetenskap vid Dartmouth och senior forskare på studien. "Eftersom du vet vad en tegelsten är och vad dess egenskaper är, du kan istället fokusera på hur tegelstenar går ihop för att bilda önskad form. Det är samma synsätt som vi tar. Vi fokuserar bara på proteinsubstrukturer som vi vet fungerar."
Proteiner är den naturliga världens arbetshäst. Proteiner hjälper oss att känna av världen omkring oss, smälta maten och bilda kroppens naturliga försvar.
I åratal, forskare har fokuserat på att bygga anpassade proteiner som kan vara användbara i människokroppen. Till exempel, anpassade proteiner kan användas för att utveckla terapeutiska läkemedel för att bekämpa sjukdomar. Dock, medan många läkemedel som insulin produceras av naturligt förekommande proteiner, området har inte avancerat för att tillåta en utbredd utveckling av syntetiska proteiner.
Bland hindren för att utveckla syntetiska proteiner är det överväldigande antalet möjliga aminosyrakombinationer. Att sortera igenom kombinationer för att hitta en som skulle vara till hjälp i ett givet scenario är en tidskrävande och resurstung process.
Forskare som utvecklar nya läkemedel fokuserar för närvarande på hur specifika atomer interagerar. Detta tillvägagångssätt kräver att laboratorier bygger stora bibliotek av varianter för att hitta en som kommer att slutföra den angivna uppgiften. Även om detta kan ge användbara resultat, forskare har funnit det utmanande att bygga atommodeller som har hög noggrannhet.
"Antalet sekvenser är praktiskt taget oändligt. Detta komplicerar verkligen processen att hitta en korrekt kombination för att fylla ett specifikt terapeutiskt behov, sa Jianfu Zhou, en Ph.D. student vid Dartmouth som var medförfattare till forskningsuppsatsen.
För att utveckla en optimerad metod för proteindesign, forskargruppen skannade en databas med 3D-modeller av 150, 000 kända proteiner. Teamet upptäckte att ett litet antal strukturella mönster ofta återkom i proteiner, och att mycket av mångfalden i proteinstruktur kommer från hur dessa byggstenar kombineras.
Denna grundläggande upptäckt fick teamet att anta att snarare än att modellera proteiner som komplexa nätverk av interagerande atomer, de kan istället representera dem mycket enklare som grupperingar av en begränsad uppsättning strukturella byggstenar.
Med den nya metoden, nya proteinstrukturer kan lättare bedömas mot etablerade mönster. Tillvägagångssättet gör det möjligt för forskare att enkelt experimentera med mer kreativa konstruktioner genom att ge chansen att kontrollera dem mot ett bibliotek av kända strukturer.
"Denna teknik tar utmaningen bort från att få fysiken helt rätt på atomskala, potentiellt göra beräkningsproteindesign till en mycket mer robust process. Våra resultat borde öppna dörrarna för maskininlärning inom proteindesign, sa Grigoryan.
Den nya processen fokuserar på de större blocken av atomer som förekommer i proteiner, kända som tertiära motiv, att designa fungerande proteiner. Dessa är återkommande strukturella arrangemang - liknande en valv eller pelare i en byggnad - som kan användas för att designa nya proteiner utan hänsyn till deras sammansättning på atomnivå.
Eftersom strukturerna bara möts på vissa sätt, forskare skulle inte längre behöva göra gissningar på atomnivå. Forskare fokuserar bara på de block som passar ihop, ignorerar de strukturer som inte skulle bilda ett fungerande protein.
Enligt forskningsrapporten, resultaten "styrker starkt att proteindatabanken nu är tillräckligt stor för att möjliggöra design av proteiner genom att endast använda exempel på strukturella motiv från orelaterade proteiner."
Genom att tillämpa den nya tekniken, forskargruppen hoppas kunna eliminera redundansen av att återupptäcka fysiska principer i proteinstrukturen genom att helt enkelt förlita sig på dessa principer i första hand.