MIT-forskare har utvecklat en maskininlärningsmodell som grupperar patienter i subpopulationer efter hälsostatus för att bättre förutsäga en patients risk att dö under vistelsen på intensivvårdsavdelningen. Denna teknik överträffar "globala" mortalitetsförutsägelsemodeller och avslöjar prestationsskillnader för dessa modeller över specifika patientunderpopulationer. Kredit:Massachusetts Institute of Technology
På intensivvårdsavdelningar, där patienter kommer in med ett brett spektrum av hälsotillstånd, triaging bygger i hög grad på klinisk bedömning. ICU -personal utför många fysiologiska tester, som blodprov och kontroll av vitala tecken, för att avgöra om patienter löper omedelbar risk att dö om de inte behandlas aggressivt.
Ange:maskininlärning. Många modeller har utvecklats under de senaste åren för att hjälpa till att förutsäga patientdödlighet på intensivvårdsavdelningen, utifrån olika hälsofaktorer under vistelsen. Dessa modeller, dock, har prestandanackdelar. En vanlig typ av "global" modell tränas på en enda stor patientpopulation. Dessa kan fungera bra i genomsnitt, men dåligt på vissa patientsubpopulationer. Å andra sidan, en annan typ av modell analyserar olika delpopulationer – till exempel, de grupperade efter liknande förhållanden, patientens åldrar, eller sjukhusavdelningar – men har ofta begränsade data för träning och testning.
I ett dokument som nyligen presenterades vid konferensen Proceedings of Knowledge Discovery and Data Mining, MIT-forskare beskriver en maskininlärningsmodell som fungerar som det bästa av två världar:Den tränar specifikt på patientsubpopulationer, men delar också data över alla delpopulationer för att få bättre förutsägelser. Genom att göra så, modellen kan bättre förutsäga en patients risk för dödlighet under de första två dagarna på ICU, jämfört med strikt globala och andra modeller.
Modellen sammanfattar först fysiologiska data i elektroniska journaler för tidigare inlagda intensivvårdspatienter, några som hade dött under sin vistelse. Genom att göra så, den lär sig höga prediktorer för dödlighet, som låg puls, högt blodtryck, och olika laboratorietestresultat - höga glukosnivåer och antal vita blodkroppar, bland annat – under de första dagarna och delar upp patienterna i subpopulationer baserat på deras hälsotillstånd. Med tanke på en ny patient, modellen kan titta på patientens fysiologiska data från de första 24 timmarna och, använda vad den har lärt sig genom att analysera dessa patientsubpopulationer, bättre uppskatta sannolikheten att den nya patienten också kommer att dö under de följande 48 timmarna.
Dessutom, forskarna fann att utvärdering (testning och validering) av modellen med specifika delpopulationer också belyser prestandaskillnader mellan globala modeller när det gäller att förutsäga dödlighet i patientpopulationer. Detta är viktig information för att utveckla modeller som mer exakt kan arbeta med specifika patienter.
"ICU har mycket hög bandbredd, med många patienter, " säger första författaren Harini Suresh, en doktorand i datavetenskap och artificiell intelligens Laboratory (CSAIL). "Det är viktigt att i god tid ta reda på vilka patienter som faktiskt är i riskzonen och som behöver mer omedelbar uppmärksamhet."
Medförfattare på uppsatsen är CSAIL doktorand Jen Gong, och John Guttag, Dugald C. Jackson professor i elektroteknik.
Multitasking och patientsubpopulationer
En viktig innovation i arbetet är att under träning, modellen separerar patienter i distinkta subpopulationer, som fångar aspekter av en patients övergripande hälsotillstånd och dödlighetsrisker. Det gör det genom att beräkna en kombination av fysiologiska data, uppdelad per timme. Fysiologiska data inkluderar, till exempel, nivåer av glukos, kalium, och kväve, samt puls, blod pH, syremättnad, och andningsfrekvens. Ökningar av blodtryck och kaliumnivåer - ett tecken på hjärtsvikt - kan tyda på hälsoproblem jämfört med andra delpopulationer.
Nästa, modellen använder en multitasking-metod för att lära sig att bygga prediktiva modeller. När patienterna delas in i subpopulationer, olika inställda modeller tilldelas varje delpopulation. Varje variantmodell kan sedan mer exakt göra förutsägelser för sin personliga patientgrupp. Detta tillvägagångssätt gör det också möjligt för modellen att dela data mellan alla delpopulationer när den gör förutsägelser. När man fick en ny patient, det kommer att matcha patientens fysiologiska data med alla subpopulationer, hitta den bästa passformen, och sedan bättre uppskatta dödlighetsrisken därifrån.
"Vi använder all patientdata och delar information mellan populationer där det är relevant, " Säger Suresh. "På detta sätt, vi kan ... inte drabbas av problem med dataknapphet, samtidigt som man tar hänsyn till skillnaderna mellan de olika patientsubpopulationerna."
"Patienter som är inlagda på intensivvårdsavdelningen skiljer sig ofta åt i varför de är där och hur deras hälsotillstånd är. På grund av detta, de kommer att behandlas väldigt annorlunda, " Gong tillägger. Kliniska beslutsfattande hjälpmedel "bör ta hänsyn till heterogeniteten i dessa patientpopulationer ... och se till att det finns tillräckligt med data för korrekta förutsägelser."
En nyckelinsikt från denna metod, Gong säger, kom från att använda en multitasking-metod för att också utvärdera en modells prestanda på specifika delpopulationer. Globala modeller utvärderas ofta i övergripande prestanda, över hela patientpopulationer. Men forskarnas experiment visade att dessa modeller faktiskt underpresterar på subpopulationer. Den globala modellen som testades i tidningen förutspådde dödligheten överlag ganska exakt, men tappade flera procentenheter i noggrannhet vid testning på enskilda delpopulationer.
Sådana prestationsskillnader är svåra att mäta utan att utvärdera av subpopulationer, Gong säger:"Vi vill utvärdera hur väl vår modell fungerar, inte bara på en hel patientkull, men också när vi bryter ner det för varje kohort med olika medicinska egenskaper. Det kan hjälpa forskare i bättre prediktiv modellutbildning och utvärdering."
Få resultat
Forskarna testade sin modell med hjälp av data från MIMIC Critical Care Database, som innehåller mängder av data om heterogena patientpopulationer. Av cirka 32, 000 patienter i datamängden, mer än 2, 200 dog på sjukhuset. De använde 80 procent av datamängden för att träna, och 20 procent för att testa modellen.
Vid användning av data från de första 24 timmarna, modellen grupperade patienterna i subpopulationer med viktiga kliniska skillnader. Två delpopulationer, till exempel, innehöll patienter med förhöjt blodtryck under de första timmarna - men ett minskade med tiden, medan den andra behöll höjden hela dagen. Denna delpopulation hade den högsta dödligheten.
Med hjälp av dessa underpopulationer, modellen förutspådde dödligheten hos patienterna under de följande 48 timmarna med hög specificitet och känslighet, och olika andra mätvärden. Multitasking -modellen överträffade en global modell betydligt med flera procentenheter.
Nästa, forskarna siktar på att använda mer data från elektroniska journaler, såsom behandlingar som patienterna får. De hoppas också, i framtiden, att träna modellen att extrahera nyckelord från digitaliserade kliniska anteckningar och annan information.
Den här historien återpubliceras med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som täcker nyheter om MIT-forskning, innovation och undervisning.