Ny forskning beskriver ett enda neuralt nätverk som kan samla in saknade data från en patient och lägga till den i deras diagram. Kredit:MIT News
MIT -forskare har utvecklat en modell som kan tillgodogöra sig flera typer av patientens hälsodata för att hjälpa läkare att fatta beslut med ofullständig information.
Området "predictive analytics" är lovande för många hälsovårdstillämpningar. Maskininlärningsmodeller kan tränas för att leta efter mönster i patientdata för att förutsäga en patients risk för sjukdom eller att dö på intensiven, för att hjälpa till med sepsisvård, eller för att utforma säkrare kemoterapiregimer.
Processen innebär att förutsäga variabler av intresse, som sjukdomsrisk, från kända variabler, som symtom, biometriska data, labbtester, och kroppsskanningar. Dock, att patientdata kan komma från flera olika källor och ofta är ofullständiga. Till exempel, det kan innehålla partiell information från hälsoundersökningar om fysiskt och psykiskt välbefinnande, blandat med mycket komplexa data som omfattar mätningar av hjärt- eller hjärnfunktion.
Att använda maskininlärning för att analysera all tillgänglig data kan hjälpa läkare att bättre diagnostisera och behandla patienter. Men de flesta modeller kan inte hantera de mycket komplexa data. Andra misslyckas med att fånga hela omfattningen av sambanden mellan olika hälsovariabler, till exempel hur andningsmönster hjälper till att förutsäga sömntimmar eller smärtnivåer.
I ett dokument som presenteras vid AAAI-konferensen om artificiell intelligens nästa vecka, MIT-forskare beskriver ett enda neuralt nätverk som tar både enkla och mycket komplexa data som input. Med hjälp av de kända variablerna, nätverket kan då fylla i alla saknade variabler. Givet data från, säga, en patients elektrokardiografi (EKG) signal, som mäter hjärtfunktionen, och självrapporterad trötthetsnivå, modellen kan förutsäga en patients smärtnivå, som patienten kanske inte kommer ihåg eller rapporterar korrekt.
Testad på en riktig sömnstudiedatauppsättning – som innehöll hälsoundersökningar, och EKG och andra komplexa signaler – nätverket uppnådde 70 till 80 procents noggrannhet i att förutsäga någon av åtta saknade variabler, baserat på de sju andra kända variablerna.
Nätverket fungerar genom att sy ihop olika undermodeller, var och en skräddarsydd för att beskriva en specifik relation mellan variabler. Undermodellerna delar data när de gör förutsägelser, och slutligen mata ut en förutsagd målvariabel. "Vi har ett nätverk av modeller som kommunicerar med varandra för att förutsäga vad vi inte vet, använda den information vi känner från dessa olika typer av data, " säger huvudförfattaren Hao Wang, en postdoc vid MIT Computer Science and Artificial Intelligence Laboratory (CSAIL). "Om du har, säga, åtta olika typer av data, och jag har fullständig information om en patient från sju, kommunikationen mellan modellerna hjälper oss att fylla i de saknade luckorna i den åttonde typen av data från de andra sju typerna. "
Med Wang på tidningen är Chengzhi Mao, en student vid Tsinghua University; CSAIL Ph.D. studenter Hao He och Mingmin Zhao; Dina Katabi, Andrew och Erna Viterbi professor i elektroteknik och datavetenskap vid MIT och chef för MIT Center for Wireless Networks and Mobile Computing; och Tommi S. Jaakkola, Thomas Siebel professor vid institutionen för elektroteknik och datavetenskap och Institutet för data, System, och samhället.
Dubbelriktade förutsägelser
Att använda traditionella maskininlärningsmodeller för att analysera antalet variabler som forskarnas nätverk kan hantera är praktiskt taget omöjligt, eftersom antalet modeller skalas exponentiellt med antalet variabler.
"Vi frågade, "Är det möjligt att designa en enda modell som kan använda alla dessa grupper av data, trots att vi i varje grupp har olika information?'" säger Wang.
Den viktigaste innovationen var att dela upp nätverket i individuella undermodeller, var och en skräddarsydd för att passa olika typer av indata. Ett neuralt nätverk är ett sammankopplat nätverk av noder som arbetar tillsammans för att bearbeta komplexa data. En nod gör relativt enkla beräkningar innan utdata skickas till nästa nod. I nätverk med undermodeller, dock, varje nod kan fungera som ett separat nätverk som kan hantera mer komplexa beräkningar. Delmodeller kan vara mycket mer effektiva, beroende på applikation.
I sitt arbete, forskarna skapade en probabilistisk undermodell för varje variabel output. De utvecklade också en teknik för att låta undermodellerna kommunicera med varandra samtidigt som de gör förutsägelser, kallas Bi-directional Inference Networks (BIN). Denna teknik utnyttjar en utbildningsteknik för neurala nätverk som kallas backpropagation. I träning, backpropagation skickar datorfel tillbaka genom noder för att uppdatera nätverkets parametervärden. Men den här tekniken används aldrig i tester, speciellt när det finns komplexa villkorade beroenden inblandade. Istället, i traditionella tester, inmatad data bearbetas från nod till nod i en riktning, tills en sista nod i slutet av sekvensen matar ut en förutsägelse.
Forskarna programmerade sitt nätverk för att använda både den traditionella metoden och backpropagation under testning. I detta sammanhang, backpropagation tar i princip en variabel utmatning, sedan förutsäga en ingång från den utgången, och skicka ingångsvärdet bakåt till en tidigare nod. Detta skapar ett nätverk där alla undermodeller arbetar tillsammans och är beroende av varandra, att mata ut en målsannolikhet.
Fyller i ämnena
Forskarna tränade sitt nätverk på den verkliga datauppsättningen Sleep Heart Health Study 2 (SHHS2). Uppgifterna inkluderar elektroencefalografi (EEG) avläsningar, som mäter hjärnans funktion; EKG; och andningsmönstersignaler. Den innehåller också information från en hälsoundersökning för att mäta åtta hälsovariabler-inklusive emotionellt välbefinnande, social funktion, och energi/trötthet – rankad på en skala från 0 till 100.
I träning, nätverket lär sig mönster för hur varje variabel kan påverka en annan. Till exempel, om någon håller andan under långa perioder, de kan vara spända, vilket kan tyda på fysisk smärta. Vid testning, nätverket kan analysera sambanden för att förutsäga någon av de åtta variablerna, baserat på någon annan information, med 70 till 80 procents noggrannhet.
Nätverket kan hjälpa till att kvantifiera ibland tvetydiga hälsovariabler för patienter och läkare, som smärta och trötthetsnivåer. När patienter sover efter operationen, till exempel, de kan vakna mitt i natten av smärta, men kommer kanske inte ihåg en lämplig smärtnivå nästa dag.
Nästa, forskarna hoppas kunna implementera nätverket som en mjukvarukomponent för en enhet de byggt, kallad EQ Radio, som kan spåra någons andning och puls med hjälp av endast trådlösa signaler. För närvarande, enheten analyserar den informationen för att dra slutsatsen om någon är nöjd, arg, eller ledsen. Med nätverket, enheten kan potentiellt göra kontinuerligt uppdaterade förutsägelser om en patients hälsa, passivt, endast delinformation ges. "Detta kan vara så användbart i anläggningar för assisterade boenden, där läkare kan övervaka både känslomässiga och fysiska dimensioner av en patients hälsa hela dagen, varje dag, " säger Wang.
Den här historien återpubliceras med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som täcker nyheter om MIT-forskning, innovation och undervisning.