Kredit:CC0 Public Domain
Ett artificiellt neuralt nätverk kan avslöja mönster i enorma mängder genuttrycksdata och upptäcka grupper av sjukdomsrelaterade gener. Det visar en ny studie ledd av forskare vid Linköpings universitet, publiceras i Naturkommunikation . Forskarna hoppas att metoden på sikt kan tillämpas inom precisionsmedicin och individualiserad behandling.
Det är vanligt när man använder sociala medier att plattformen föreslår personer som man kanske vill lägga till som vänner. Förslaget bygger på att du och den andra personen har gemensamma kontakter, vilket tyder på att ni kanske känner varandra. På liknande sätt, forskare skapar kartor över biologiska nätverk baserat på hur olika proteiner eller gener interagerar med varandra. Forskarna bakom en ny studie har använt artificiell intelligens, AI, att undersöka om det är möjligt att upptäcka biologiska nätverk med hjälp av djupinlärning, i vilka enheter som kallas "artificiella neurala nätverk" tränas av experimentella data. Eftersom artificiella neurala nätverk är utmärkta på att lära sig att hitta mönster i enorma mängder komplex data, de används i applikationer som bildigenkänning. Dock, denna maskininlärningsmetod har hittills sällan använts i biologisk forskning.
"Vi har för första gången använt djupinlärning för att hitta sjukdomsrelaterade gener. Detta är en mycket kraftfull metod för analys av enorma mängder biologisk information, eller Big Data, " säger Sanjiv Dwivedi, postdoc vid institutionen för fysik, Kemi och biologi (IFM) vid Linköpings universitet.
Forskarna använde en stor databas med information om uttrycksmönstren för 20, 000 gener i ett stort antal människor. Informationen var "osorterad, "i den meningen att forskarna inte gav det artificiella neurala nätverket information om vilka genuttrycksmönster som kom från människor med sjukdomar, och som var från friska människor. AI-modellen tränades sedan för att hitta mönster av genuttryck.
En av utmaningarna med maskininlärning är att det inte går att se exakt hur ett artificiellt neuralt nätverk löser en uppgift. AI beskrivs ibland som en "svart låda" - vi ser bara informationen som vi lägger i lådan och resultatet som den producerar. Vi kan inte se stegen mellan. Artificiella neurala nätverk består av flera lager där information bearbetas matematiskt. Nätverket innefattar ett ingångsskikt och ett utgångsskikt som levererar resultatet av den informationsbehandling som utförs av systemet. Mellan dessa två lager finns flera dolda lager i vilka beräkningar utförs. När forskarna hade tränat det artificiella neurala nätverket, de undrade om det var möjligt att lyfta locket på den svarta lådan, så att säga, och förstå hur det fungerar. Är designen av det neurala nätverket och de välbekanta biologiska nätverken lika?
"När vi analyserade vårt neurala nätverk, det visade sig att det första dolda lagret i stor utsträckning representerade interaktioner mellan olika proteiner. Djupare i modellen, i kontrast, på tredje nivån, vi hittade grupper av olika celltyper. Det är oerhört intressant att den här typen av biologiskt relevant gruppering automatiskt produceras, med tanke på att vårt nätverk har utgått från oklassificerade genuttrycksdata, säger Mika Gustafsson, universitetslektor vid IFM och ledare för studien.
Forskarna undersökte sedan om deras modell av genuttryck kunde användas för att bestämma vilka genuttrycksmönster som är förknippade med sjukdomar och vilka som är normala. De bekräftade att modellen hittar relevanta mönster som stämmer väl överens med biologiska mekanismer i kroppen. Eftersom modellen har tränats med hjälp av oklassificerade data, det är möjligt att det artificiella neurala nätverket har hittat helt nya mönster. Forskarna planerar nu att undersöka om sådana, tidigare okända mönster, är relevanta ur ett biologiskt perspektiv.
"Vi tror att nyckeln till framsteg på området är att förstå det neurala nätverket. Detta kan lära oss nya saker om biologiska sammanhang, såsom sjukdomar där många faktorer samverkar. Och vi tror att vår metod ger modeller som är lättare att generalisera och som kan användas för många olika typer av biologisk information, säger Mika Gustafsson.
Mika Gustafsson hoppas att ett nära samarbete med medicinska forskare ska göra det möjligt för honom att tillämpa metoden som utvecklats i studien inom precisionsmedicin. Det kan vara möjligt, till exempel, att avgöra vilka grupper av patienter som ska få en viss typ av medicin, eller identifiera de patienter som är hårdast drabbade.