Stockbyte/Stockbyte/Getty Images
Genomics, en banbrytande gren av genetik, undersöker storskaliga förändringar i levande organismers DNA. Dess underområde, transcriptomics, kartlägger hur gener transkriberas till RNA över hela genom. Att hantera dessa enorma, komplexa datauppsättningar kräver sofistikerade beräkningsverktyg – en skärningspunkt mellan biologi och datavetenskap som kallas bioinformatik.
Det mänskliga genomet innehåller ungefär 3 miljarder baspar och cirka 25 000 proteinkodande gener. Däremot uppskattas fruktflugans genom till 165 miljoner baspar med cirka 13 000 gener. Transcriptomics ger ytterligare djup genom att avslöja vilka av dessa tusentals gener som är aktiva vid specifika tidpunkter och under olika experimentella förhållanden – information långt bortom räckhåll för manuell analys.
Genetiska data är bara meningsfulla när de ses genom biologins lins. Gener, proteiner, celler och vävnader samverkar under strikta reglerande regler som formar livet. Bioinformatik översätter råa sekvensnummer till biologiskt meningsfulla mönster, vilket gör att forskare kan ställa frågor som annars skulle vara omöjliga.
Moderna bioinformatikpipelines kan bearbeta tiotusentals variabler på några minuter, tack vare kraftfulla algoritmer som hierarkisk klustring och principal komponentanalys. Dessa verktyg identifierar relationer och mönster över stora datamängder – ungefär som att se vanliga efternamn i en telefonbok.
Genom att integrera data om tusentals interagerande komponenter gör bioinformatik det möjligt för systembiologi att modellera hela biologiska nätverk. Istället för att studera en gen i taget, undersöker forskare nu hur hela vägar koordinerar – ungefär som att observera en flock fåglar eller ett fiskstim som rör sig samtidigt.