• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Andra
    Den överraskande kraften hos små data – mer information är inte nödvändigtvis bättre inom hälsovård eller företag

    Upphovsman:CC0 Public Domain

    Kroniska tillstånd som hjärtsjukdomar och diabetes har ökat i årtionden. De är den främsta orsaken till dödsfall och funktionshinder i USA idag och en anledning till att sjukvårdskostnaderna är utom kontroll.

    Så att identifiera personer i riskzonen för kroniska tillstånd innan de blir sjuka är mycket vettigt. Åtminstonde, Tidiga insatser kan ofta bromsa sjukdomstakten och förbättra patienternas livskvalitet – och på så sätt, eventuellt spara miljarder dollar i medicinska kostnader.

    Det är därför många arbetsgivare - cirka 50%, enligt en RAND-rapport — sponsra incitamentsprogram för friskvård för sina anställda. Tillsammans med gymrabatter, dessa program inkluderar vanligtvis en hälsoriskbedömning i form av labbtester som används för att beräkna varje persons riskfaktorer för vanliga sjukdomar. De i riskzonen erbjuds då extra förebyggande vård och tillsyn.

    Tyvärr, de förväntade fördelarna förverkligas inte alltid, säger Mohsen Bayati, en docent i operationer, information, och teknik vid Stanford Graduate School of Business. Flera studier har funnit att sådana program kan sluta kosta mer pengar än de sparar. En trolig anledning, han säger, är att riskbedömningarna i sig inte är så exakta.

    "Om du felaktigt identifierar någon som hög risk - en så kallad "falsk positiv" - betalar du för onödiga tjänster, "Säger Bayati." Och om du saknar någon som verkligen riskerar - ett falskt negativt - då blir du fortfarande drabbad av de stora medicinska räkningarna i framtiden. "

    En lösning, han säger, skulle vara att köra en mer genomarbetad panel av tester. Men det skulle också öka kostnaden. "Labbtest är dyra. Företag gör detta för många anställda, så de tittar på en ganska liten uppsättning vanliga biomarkörer. Och då är detektionsförmågan inte särskilt stark."

    Istället, Bayati säger, nyckeln till att få dessa förebyggande program att fungera är att förbättra urvalet av biomarkörer. Men hur gör du det? För att uttrycka det mer rigoröst:Hur väljer du en minimal uppsättning markörer som kommer att maximera den diagnostiska kraften över en rad sjukdomar?

    Det är pusslet Bayati tog sig an i en ny tidning, som han skrev tillsammans med två Stanford-kollegor:Sonia Bhaskar, Ph.D., en tidigare Stanford -forskningsassistent som nu arbetar som datavetare på Netflix, och Andrea Montanari, en professor i statistik och elektroteknik. Använder lite teknisk jujitsu från området maskininlärning, de utvecklade en metod som kan användas för vilken grupp av målsjukdomar som helst eller programbudgetnivå.

    När de testade det i journaler för cirka 75, 000 patienter, de fann att det kunde förutsäga en grupp med nio allvarliga sjukdomar med oväntad noggrannhet. "Vi blev förvånade, " säger Bayati. Jämfört med en hypotetisk Cadillac-vårdsbedömning utan gräns för antalet biomarkörer, deras skulle kosta mycket mindre, ändå har nästan samma nivå av prediktiv kraft.

    Och kanske finns det en allmän lektion här, i denna era av Big Data. "Du måste undra, " Bayati funderar. "I alla branscher, företag investerar resurser för att samla in allt mer data. Vi sätter sensorer på allt, bara för att vi kan, och ärligt talat, det är inte allt nödvändigt eller användbart."

    För mycket information

    Traditionellt, hälsoriskbedömningar har utformats genom att ta reda på de bästa markörerna för varje sjukdom isolerat och lägga till dem i en lista. "Sjukhusen blir mer sofistikerade i hur de identifierar biomarkörer, med avancerad statistik och nu AI, " säger Bayati. "Men det görs en sjukdom i taget."

    Du kan eventuellt bygga en effektiv testpanel på det här sättet, han säger, men det skulle kräva alldeles för många biomarkörer. Så i praktiken, kompromisser görs och noggrannheten minskar. Istället, Bayati och hans kollegor lade till ett andra steg till analysen:"Vi sa, låt oss börja med den kompletta listan och sedan se om vi kan förenkla den på ett bättre sätt för att minimera förlusten av diagnostisk kraft."

    Att göra det, de hämtade några tekniker från högdimensionell statistik som används i maskininlärning. "Den grundläggande frågan är, om du har för mycket information, hur kan du begränsa den till den mest användbara mindre uppsättningen information? Hur minskar du datamängden? "

    Matematiken är inblandad, men i grunden, nyckeln till att lösa det "TMI"-problemet är att gemensamt optimera urvalet av biomarkörer. Istället för att hitta de bästa för varje sjukdom separat, bestäm först hur många biomarkörer du vill ha – forskarna slog fast vid 30 – och maximera sedan prediktiv kraft, över alla möjliga kombinationer, för hela uppsättningen av sjukdomar på en gång.

    Modellen fungerar eftersom många biomarkörer signalerar mer än en sjukdom. Högt blodsocker, till exempel, kan vara ett tecken på diabetes, men också njursjukdom, leversjukdom, eller hjärtsjukdom. Onormala nivåer av alkaliskt fosfatas är förknippade med hjärtsjukdomar, leversjukdom, och cancer. "Om din urvalsprocess inte tar hänsyn till dessa överlappningar, du slänger information, " säger Bayati.

    Ingen gräns för mål

    Styrkan med metoden Bayati och hans kollegor beskriver är att den kan användas för att uppnå flera mål samtidigt. Vad är viktigare i hälsoriskbedömningar:noggrannhet eller kostnad? Både, självklart. Vill vi förutsäga Alzheimers eller artärsjukdom? Ja.

    "Det finns ingen gräns för antalet mål, " säger Bayati. "Du kan lista 20, 30, 100 mål som du vill optimera över. Och sedan kan du begränsa informationen du behöver samla in – för någon gång, att lägga till mål kräver inte ytterligare data."

    Om det hjälper till att uppfylla löftet om företagens hälsoprogram, det är en stor sak för sjukvården. Men detta tillvägagångssätt kan också användas för att förbättra en rad affärs- och offentligpolitiska verksamheter. Vad som är avgörande, Bayati säger, är att vara tydlig med målen. Datorer kan göra analysen, men människor måste tala om för dem vad de ska optimera.

    Och det är ett steg, han tror, företag slänger alltför ofta. "Ibland verkar det som om företag bara skyndar sig att samla in data och ställer frågor senare. Men mer information är inte nödvändigtvis bättre. Det viktiga är att veta vad de ska titta på. Vårt papper är ett steg i den riktningen."


    © Vetenskap https://sv.scienceaq.com