• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Djup inlärning hjälper till att reta ut geninteraktioner

    Kredit:CC0 Public Domain

    Dataforskare vid Carnegie Mellon University har tagit en metod för djupinlärning som har revolutionerat ansiktsigenkänning och andra bildbaserade applikationer de senaste åren och omdirigerat dess makt att utforska sambandet mellan gener.

    Tricket, de säger, är att omvandla enorma mängder genuttrycksdata till något mer bildliknande. Konvolutionella neurala nätverk (CNN), som är skickliga på att analysera visuella bilder, kan sedan sluta sig till vilka gener som interagerar med varandra. CNN:erna överträffar befintliga metoder vid denna uppgift.

    Forskarnas rapport om hur CNN kan hjälpa till att identifiera sjukdomsrelaterade gener och utvecklings- och genetiska vägar som kan vara mål för läkemedel publiceras idag i Proceedings of the National Academy of Science . Men Ziv Bar-Joseph, professor i beräkningsbiologi och maskininlärning, sa applikationerna för den nya metoden, kallas CNNC, kan gå långt utöver geninteraktioner.

    Den nya insikten som beskrivs i tidningen antyder att CNNC på liknande sätt skulle kunna användas för att undersöka kausalitet i en mängd olika fenomen, inklusive finansiella data och sociala nätverk, sade Bar-Joseph, som skrev tidningen tillsammans med Ye Yuan, en postdoktor vid CMU:s maskininlärningsavdelning.

    "CNN, som utvecklades för ett decennium sedan, är revolutionerande, " Sa Bar-Joseph. "Jag är fortfarande vördnad över Google Foto, som använder dem för ansiktsigenkänning, " lade han till när han bläddrade igenom foton på sin smartphone, visar hur appen kunde identifiera hans son i olika åldrar, eller identifiera sin far baserat på en bild av den bakre högra sidan av hans huvud. "Vi tar ibland den här tekniken för given eftersom vi använder den hela tiden. Men den är otroligt kraftfull och är inte begränsad till bilder. Allt handlar om hur du representerar din data."

    I detta fall, han och Yuan tittade på genrelationer. De cirka 20, 000 gener hos människor samverkar, så det är nödvändigt att veta hur gener samverkar i komplex eller nätverk för att förstå mänsklig utveckling eller sjukdomar.

    Ett sätt att sluta sig till dessa samband är att titta på genuttryck - som representerar aktivitetsnivåerna för gener i celler. Rent generellt, om gen A är aktiv samtidigt som gen B är aktiv, det är en ledtråd om att de två interagerar, sa Yuan. Fortfarande, det är möjligt att detta är en slump eller att båda aktiveras av en tredje gen C. Flera tidigare metoder har utvecklats för att reta ut dessa samband.

    Att anställa CNN för att analysera genförhållanden, Yuan och Bar-Joseph använde encellsexpressionsdata - experiment som kan bestämma nivån av varje gen i en enda cell. Resultaten av hundratusentals av dessa encellsanalyser arrangerades sedan i form av en matris eller histogram så att varje cell i matrisen representerade en annan nivå av samuttryck för ett par gener.

    Att presentera data på detta sätt tillförde en rumslig aspekt som gjorde data mer bildliknande och, Således, mer tillgänglig för CNN. Genom att använda data från gener vars interaktioner redan hade fastställts, forskarna kunde träna CNN att känna igen vilka gener som interagerade och vilka som inte var baserade på de visuella mönstren i datamatrisen, sa Yuan.

    "Det är väldigt, mycket svårt att skilja mellan kausalitet och korrelation, " Yuan sa, men CNNC-metoden visade sig statistiskt mer korrekt än befintliga metoder. Han och Bar-Joseph räknar med att CNNC kommer att vara en av flera tekniker som forskare så småningom kommer att använda för att analysera stora datamängder.

    "Detta är en mycket allmän metod som skulle kunna tillämpas på ett antal analyser, ", sa Bar-Joseph. Den huvudsakliga begränsningen är data – ju mer data det finns, desto bättre fungerar CNN. Cellbiologi är väl lämpad för att använda CNNC, som ett typiskt experiment kan involvera tiotusentals celler och generera en enorm mängd data.


    © Vetenskap https://sv.scienceaq.com