Big data är ett av de mest kraftfulla verktygen vi har i kampen mot sjukdomar. Ju mer data vi har i handen, ju mer utbildade vi kan vara i de vårdval vi gör. Data kan ge ett landskap om ett visst samhälles hälsa och lära oss om patientgemensamheter så att vi kan uppskatta riskfaktorer. Det kan hjälpa oss att lära oss mer om sjukdomar och därför hitta ett botemedel, eller låt oss se hur utbrott reser för att effektivt innehålla dem.
Datavetenskap är ett av de mest tvärvetenskapliga områdena som finns. Forskare, läkare, matematiker, datorprogrammerare och epidemiologer är bara några av de yrken som arbetar med datavetenskap. Alla människor spelar en roll i att antingen samla in data, analyserar det, ta reda på hur man använder det eller agerar på det.
Här är tio sätt som datavetenskap har använts för olika sjukdomar och epidemier.
InnehållAlla cancerformer kan inte förebyggas, men skulle du inte vilja stoppa de som är? Screening för predisposition och tidig tillväxt finns för livmoderhals, bröst, lunga, prostatacancer och tjocktarmscancer. Men hur bestämmer läkare riktlinjer för vem som ska screenas, hur ofta och när? Svaret ligger i big data.
Den amerikanska arbetsgruppen för förebyggande tjänster använder högkvalitativa stora data från stora epidemiologiska studier för att fastställa riktlinjer för screening. Till exempel, från att studera frekvensen av falskpositiva cancerdiagnoser hos kvinnor i 40-årsåldern, arbetsgruppen fastställde att det inte är nödvändigt att ta mammografi före 50 års ålder (om det inte finns någon historia av bröstcancer i familjen) [källa:WebMD].
Att dra så mycket data som möjligt från cancerpatienter lär också läkare om hur cancer växer. Oregon Health and Science University genomför försök med gensekvensering av tusentals cancerpatienter för att lära sig mer om hur cancerbildning uppstår hos olika människor så att de kan erbjuda snabbare diagnoser. Universitetet ser till och med för att kunna diagnostisera cancer inom 24 timmar senast 2020, tack vare vad de lär sig [källa:Oregon Health and Science University].
Myggor har länge varit spridare av sjukdomar som malaria och denguefeber, så att samla information om vilka typer av myggor som bär dessa sjukdomar och var de lever kan hjälpa oss i vår kamp mot dessa tillstånd. Det senaste utbrottet av det myggburna viruset Zika har visat oss hur skrämmande det kan vara att ha brist på data om hur en sjukdom sprider sig och vad den kan göra med människor.
För att bekämpa dessa sjukdomar med myggspridning, forskare från IBM, Johns Hopkins och University of California San Francisco har samarbetat för att skapa programvara med öppen källkod som gör att epidemiologer kan göra förutsägbara sjukdomsmodeller [källa:Ungerleider]. Programvaran är utformad så att epidemiologer med minimal kodningskunskap fortfarande kan använda den för att köra dataanalys, förutsäga utbrottets bana och planera strategier för att begränsa spridning av sjukdomar.
Programmet använder data från Världshälsoorganisationen som visar en regions allmänna känslighet för utbrott, befolkningsmodeller av både människor och mygg, och klimatdata som identifierar potentiella utbrottslägen. Tagen tillsammans, dessa data kan bromsa spridningen av myggburna virus.
Parkinsons sjukdom, ett neurologiskt tillstånd som drabbar mer än 10 miljoner människor världen över, ger ett bra exempel på hur datainsamling i kombination med teknik kan göra skillnad i vården [källa:Parkinsons sjukdom Foundation].
En person med Parkinsons har ofta mycket allvarliga kroppsskakningar. Dessa orsakas av att hans eller hennes hjärna långsamt slutar producera en signalsubstans som kallas dopamin. Ju mindre dopamin en person har, desto mindre kan han kontrollera sina rörelser och känslor [källa:National Parkinson Foundation].
Dock, när han har synliga symptom (som skakningar) och får diagnosen Parkinson, så mycket som 80 procent av neuronerna i hans hjärna i samband med dopamin har förstörts [källa:Feber]. Det finns för närvarande inget botemedel mot Parkinson, det finns behandlingar för att hålla symptomen under kontroll. Så, om läkare kan upptäcka symtom tidigare, då kan behandlingen börja tidigare.
För detta ändamål, flera företag har undersökt bärbar teknik för att samla in data om knappt märkbara skakningar, gånggång och sömnkvalitet. När uppgifterna dras ihop, det kan ge information till teknikbärarna om de kan ha en anlag för Parkinsons sjukdom och hjälpa dem att få behandling tidigt. Att samla in denna enorma mängd data i ett centralt nav ger också läkare och forskare möjligheten att söka efter röda trådar hos Parkinsons patienter, kanske en dag som leder till ett botemedel.
Från 2014-2015, ett massivt utbrott av ebola inträffade, mestadels i Västafrika. Mer än 11, 000 människor dog av denna sjukdom enbart i regionen [källa:Centers for Disease Control and Prevention (CDC)]. Med utbrottet av viruset inträffar i några av de fattigaste länderna i världen, det var svårt att få medicinsk information till medborgarna, och det fanns lite infrastruktur för att bekämpa sjukdomen. En stor oro i den globala kampen mot ebola var att förstå var viruset sprider sig för att avgöra vilka områden som har de mest akuta behoven av bistånd. Och det var här datavetenskapen kom in.
Med hjälp av mappningsprogram i realtid, forskare och folkhälsoarbetare kan spåra sjukdomen i hela Afrika och förutsäga de mest sårbara områden som kan ge efter för ett utbrott i framtiden. Sammanställning av datapunkter om platsen för fladdermusarter (den troliga bäraren av Ebola -viruset), befolkningstäthet, restid från närmaste större bosättning, och en handfull andra faktorer, forskare kan komma framför sjukdomen.
Kartverktyget lanserades på en workshop i februari 2016. "Jag kan enkelt gå igenom kartorna och se specifikt distrikten i Ghana där ebolavirusets nisch är, var kommer det sannolikt att bli ett utbrott, och därifrån kan vi göra djurövervakning, "sade deltagaren Dr. Richard Suu-Ire, chef för djurveterinärenheten i Ghana som ansvarar för att samla fladdermusprover för Ebola -övervakning i sitt land [källa:Fortunati].
Ett av de mest kraftfulla sätten att data kan användas inom medicin är att beräkna risk. När tillräckligt med datapunkter samlas in och analyseras, läkare och folkhälsoarbetare kan inte bara avgöra vilka faktorer som kan spela en roll vid en sjukdom, men också den utlösande punkt där någon kan löpa stor risk att drabbas av den.
Hjärtsjukdomar är ett utmärkt exempel på detta. Det är dödsorsak nr 1 i USA, hänför sig till var fjärde dödsfall [källa:CDC]. Tidigare, läkare brukade beräkna risken för hjärtsjukdomar, främst med kolesterolvärden. Om kolesterolet var högt, patienter ordinerades medicinering; om låg, de ansågs inte vara i fara.
Dock, med hjälp av en insamling av data som samlats in från flera källor, American College of Cardiology och American Heart Association hittade gemensamma egenskaper hos patienter med hjärtsjukdomar som sträckte sig långt utöver att helt enkelt ha högt kolesterol. Med massiva datamängder om vikt, lopp, ålder, historia, kolesterol och några andra faktorer, grupperna har genererat ett test som fungerar som en mycket mer omfattande och personlig riskkalkylator, kallad ASCVD Risk Estimator [källa:Gaglioti]. Som ett resultat, läkare har ändrat sättet att träna och beräkna risken för hjärtsjukdomar.
Droganvändning kan härja samhällen, precis som många sjukdomar gör. Antalet dödsfall från överdosering i USA är häpnadsväckande - över 47, 000 bara 2014 [källa:American Society of Addiction Medicine]. Faktiskt, överdosering av läkemedel är den främsta orsaken till oavsiktlig död i USA, och opioidberoende driver de flesta dödsfallen.
Att spåra dödsdata i olika samhällen kan ge vårdgivare, regeringar och samhällsaktivister en solid uppfattning om hur droger kan påverka en viss region. Baserat på dessa uppgifter, de kunde veta var särskilt dödliga stammar av droger kan infiltrera städer och använda regeringens åtgärder för att stoppa spridningen. Att ta reda på mer om var människor dör av överdoser kan leda till regeringar i vilka samhällen behöver ingripanden, såsom rehabiliteringstjänster eller läkare för att tillhandahålla strategier för att minska skador.
Denna typ av strategi har hjälpt många landsbygdssamhällen att vidta åtgärder mot opioidepidemin, vilket leder till mycket positiva resultat. Flera landsbygdsområden i USA har följt de rehabiliteringsstrategier som framställts av Gloucester, Massachusetts polisavdelning som, på bara ett år, ledde till att mer än 400 patienter hänvisades till behandling och övernattningskostnader sjönk med 75 procent. Till exempel, alla med ett beroende kan gå in på polisavdelningen och personal till hands hjälper till att få dem in i ett behandlingsprogram [källa:Toliver].
Till sist, att ha läkemedelsrelaterade dödlighetsdata i handen har fått Centers for Disease Control and Prevention att komma med riktlinjer för läkare om opioidrecept [källa:Gaglioti]. Data hjälper inte bara till att bekämpa epidemin, men det kommer också till roten till problemet och kan stoppa missbruk innan det tar tag.
Ibland behöver uppgifterna inte vara "stora" för att ha stor inverkan på att bekämpa sjukdomar. En mindre, fokuserad uppsättning data kan vara ögonöppnande om hälsan i ett samhälle. Flintan, Michigan, vattenkris är ett perfekt exempel.
En undersökning av en civilingenjör visade att vattenprover från Flint -hem innehöll höga halter bly; dock, bevisen som han fick fram var inte tillräckligt för att övertyga regeringens ledare om att vattnet var förorenat. Efter att ha hört talas om ingenjörens studie, en barnläkare i stan bestämde sig för att samla ihop sin egen datauppsättning.
Dr Mona Hanna-Attisha samlade information från sjukhusjournaler och hittade utomordentligt höga halter bly i blodet hos barnpatienter. Istället för att vänta på att få sina resultat publicerade i en medicinsk tidskrift, hon höll en presskonferens, och stadens tjänstemän tvingades lyssna.
Blyförgiftning kan ha långsiktiga effekter på ett barns hjärnans utveckling och beteende, och i Flint, nästan 27, 000 barn utsattes för bly i stadens vatten [källa:D'Angelo]. Utan datamängden som bevisade att det var något fel, tusentals fler barn kunde ha skadats.
Pooler med stora data är bra platser att fiska efter mönster. Forskare och läkare kommer ibland att delta i långsiktiga studier av specifika grupper av människor för att lära sig om det finns några gemensamma faktorer för hur deras hälsa utvecklas. Till exempel, folkhälsoarbetare är för närvarande engagerade i en studie av 9/11 första responders för att lära sig de långsiktiga effekterna av deras exponering vid Ground Zero. Att kunna tillskriva sällsynta cancer och andningssjukdomar som de kan utveckla till denna exponeringsvapenläkare och regeringen med mer information om hur man inrättar vård- och stödsystem.
En av de mest effektfulla kohortstudierna är Women's Health Initiative (WHI). Lanserades 1993, denna långsiktiga kliniska prövning samlade in data om 161, 000 postmenopausala kvinnor för att lära sig strategier för att förebygga hjärtsjukdomar, bröst- och kolorektal cancer, och osteoporotiska frakturer [källa:WHI].
De mönster forskarna noterade hos dessa kvinnor har förändrat hur vårdgivare förebygger och behandlar dessa sjukdomar, ger en enorm avkastning på investeringen. Forskare använde en sjukdomsimuleringsmodell över nio års intervall (2003-2012) för att jämföra skillnaderna i kvinnors hälsa baserat på resultaten från WHI-studierna.
Modellen visade att genom att följa riktlinjerna från WHI, det var 76, 000 färre fall av hjärt -kärlsjukdom, 126, 000 färre bröstcancerfall och 4,3 miljoner färre användare av kombinerad hormonbehandling. Ytterligare, sjukdomsmodellsimuleringen visade att genom att använda resultaten från WHI under den nioåriga sträckan, Amerikaner sparade uppskattningsvis 35,2 miljarder dollar i direkta kostnader för sjukvård [källa:National Institutes of Health].
Trots pådraget varje år för att uppmuntra människor att vaccinera sig mot influensa, denna mycket smittsamma andningssjukdom lyckas fortfarande slå miljoner människor i USA varje år och döda tusentals av dem som blir sjuka [källa:CDC].
En person med influensa kan infektera andra en dag innan symptom uppstår, och upp till sju dagar efter att hon blivit sjuk, så att veta var och när influensan når sin topp i ett land är verkligen värdefullt [källa:CDC].
Webbplatsen FluNearYou.org tillåter amerikaner att publicera symptom de har i veckovisa hälsorapporter. Tusentals individer skickar in sina rapporter till webbplatsen, och forskare kartlägger data från folkmassorna för att hitta vilka symptom som finns och på vilka platser i landet.
Datavetenskap, dock, är inte alltid perfekt. Google fördjupade sig i världen av influensaprognoser med sina Google Flu Trends (GFT). Baserat på människors sökningar av symptom, de hävdade att de kunde samla in tillräckligt med data för att ge exakta uppskattningar av influensaprevalens upp till två veckor tidigare än CDC [källa:Lazer]. Tyvärr, GFT misslyckades med att förutsäga en stor influensatopp under 2013 (dess algoritm inkluderade för många säsongsbetonade söktermer som inte var relaterade till influensa). Medan GFT misslyckades, begreppet crowdsourcing av data för att göra förutsägelser om sjukdom är en som ofta fungerar ganska bra.
Att samla in data i ett centralt nav är inte det enda sättet vi kan använda crowdsourcing för att hjälpa sjukdomar. Crowdsourcing -datorer för att bearbeta informationen är lika viktigt.
World Community Grid är en insats som ligger i spetsen av IBM som ber människor att skänka extra datorkraft för sina personliga enheter för att bekämpa sjukdomar. När din enhet är inaktiv, det kan göra forskningsberäkningar för forskare, så resultat som skulle ha tagit decennier kan uppnås i månader. Crowdsourced -datorer har kört simuleringar av cellulära funktioner för att förstå sjukdomar som tuberkulos; screenade miljontals kemiska föreningar mot målproteinerna som Zika sannolikt använder för att trivas i människokroppar och identifierade genetiska markörer för att förutse cancer.
Mer än 700, 000 volontärer har redan registrerat sig för att hjälpa till med dessa olika projekt [källa:World Community Grid]. Med mängden ledig tid som våra kollektiva enheter kan erbjuda dessa orsaker, detta är ett sätt att big data kan göra stor skillnad.
När jag läste om hur data kan samlas in för det goda fick jag verkligen lyst att delta i något som FluNearYou. Det skulle kännas bra att vara en av de data som hjälper till att forma bilden av hälsolandskapet, därmed påverkar läkarnas sätt att välja behandlingsplaner. Alla kan göra sin egen lilla del!