I en artikel som nyligen publicerades i Nature Communications , HUN-REN-ELTE Protein Modeling Research Group (Institute of Chemistry) har lagt grunden för en matematisk metod som möjliggör datorstödd jämförelse av proteiners tredimensionella strukturer. Metoden är unik genom att medan de alternativ som finns tillgängliga hittills endast tagit hänsyn till atomernas position, inkluderar den nya tekniken, kallad LoCoHD (Local Composition Hellinger Distance), även atomernas kemiska information.
Proteiner är molekylära maskiner som utför processer som är nödvändiga för att celler ska fungera, fungerar som molekylära switchar, transkriberar information från DNA, transporterar små och stora molekyler och reglerar metabolismrelaterade kemiska reaktioner. Men för att allt detta ska lyckas måste proteinet i fråga ha rätt rumslig konformation, det vill säga sitt eget, korrekta 3D-arrangemang.
Flera experimentella metoder (röntgenkristallografi, kärnmagnetisk resonansspektroskopi, kryo-elektronmikroskopi) finns tillgängliga för att bestämma arrangemanget av atomer i ett protein, och under de senaste decennierna har proteinforskare upptäckt formen på nästan 220 000 proteiner. Dessa resultat kräver alltmer utveckling av beräkningsmetoder som kan analysera dessa arrangemang.
En sådan metod är algoritmen som kallas LoCoHD, utvecklad av Zsolt Fazekas, en Ph.D. kandidat vid ELTE Hevesy György School of Chemistry och forskare i Dr. András Perczels forskargrupp. Algoritmen jämför lokala miljöer kring aminosyror i proteiner baserat på deras kemiska natur (t.ex. elementär sammansättning, laddning, hydrofobicitet, etc.).
Metoden avgör på en enkel skala från 0 till 1 hur olika strukturerna i fråga är från varandra. Värden nära 0 tyder på en hög likhet mellan atomarrangemang och kemiska egenskaper, medan värden nära 1 indikerar att de proteiner som jämförs kan ha mycket olika egenskaper. Det resulterande numeriska värdet (en så kallad metrik) kan alltså användas för att få ny information om det studerade systemet.
Algoritmen använder ett flerstegsprotokoll för att generera numret som representerar de strukturella skillnaderna. I det första steget omvandlar den verkliga atomer i proteinet till så kallade primitiva atomer. Dessa kan representeras som praktiskt taget märkta positioner vars etiketter berättar om den ursprungliga atomens kemiska natur.