En ny maskininlärningsalgoritm kan förutsäga hur gener regleras i enskilda celler, ett genombrott som kan leda till nya behandlingar för en mängd olika sjukdomar.
Algoritmen, utvecklad av forskare vid University of California, Berkeley, kan identifiera de specifika DNA-sekvenser som styr uttrycket av gener. Denna information kan användas för att utveckla läkemedel som riktar sig mot dessa sekvenser och antingen slå på eller av gener.
"Detta är ett stort genombrott i vår förståelse av hur gener regleras", säger studieledaren John L. Rinn, PhD, docent i molekylär- och cellbiologi vid UC Berkeley. "Denna nya algoritm kommer att tillåta oss att identifiera de viktigaste reglerande elementen i genomet och utveckla nya terapier för en mängd olika sjukdomar."
Algoritmen, som kallas cis-BPNet, tränades på ett stort dataset av genuttrycksdata från olika celltyper. Algoritmen kunde lära sig sambanden mellan DNA-sekvenserna och uttrycket av gener, och den kan nu förutsäga hur gener kommer att uttryckas i olika celltyper.
Forskarna testade algoritmen på en mängd olika gener, och de fann att den kunde exakt förutsäga uttrycket av gener i olika celltyper. Algoritmen kunde också identifiera de viktigaste regulatoriska elementen i genomet som styr uttrycket av gener.
Denna information kan användas för att utveckla läkemedel som riktar sig mot dessa reglerande element och antingen slå på eller av gener. Detta kan leda till nya behandlingar för en mängd olika sjukdomar, såsom cancer, diabetes och hjärtsjukdomar.
"Detta är ett kraftfullt nytt verktyg som gör att vi kan förstå hur gener regleras och utveckla nya terapier för en mängd olika sjukdomar", säger Rinn.
Studien publicerades i tidskriften Cell .