Kredit:CC0 Public Domain
Big datas ålder är här:Världen har skapat mer data under de senaste två åren än i hela mänsklighetens tidigare historia. Forskare vid USC Leonard Davis School of Gerontology dissekerar skattkammare av information – från så olika källor som hjärnskanningar och det mänskliga genomet – för att underblåsa banbrytande forskning om att förbättra hur vi åldras, och att omforma gerontologiutbildningen så att framtida forskare kan påverka ett föränderligt område.
Gerontology är redo att ta sig an de senaste verktygen – delvis för att området alltid har involverat stora datamängder, säger Mireille Jacobson, en mikroekonom och docent i gerontologi vid USC Leonard Davis School. Till exempel, hennes arbete har förlitat sig på stora populationsdatauppsättningar – och på ett sätt, det har inte förändrats, hon säger. "Det är mest det att mer och mer data finns tillgänglig."
Jacobson arbetar med data från Medicare och andra allmänt tillgängliga databaser för att förstå hur sjukförsäkringen påverkar äldre människors välbefinnande. Till exempel, en analys av Medicare-data fann att att ta emot Medicare-förmåner kan hjälpa till att minska ekonomisk stress hos personer över 65. Hon forskar också om vårdgivare och hur de fattar vårdbeslut som svar på olika yttre faktorer, inklusive nya screeningsrekommendationer och läkemedelsbrist.
"Ansträngningen att digitalisera och göra allt tillgängligt elektroniskt är en ny sak, " tillägger hon.
Jacobson är en del av en grupp gerontologiforskare vid USC Leonard Davis School som dyker ner i stora datamängder för att bättre förstå åldrande och livslängd. Deras arbete har viktiga konsekvenser för utbildning av studenter och för att skapa bättre datamängder, som kan hjälpa forskare att bättre förstå individuella riskfaktorer, identifiera genernas roll vid sjukdom och utveckla mer exakta ingrepp.
Flytta över discipliner
Em Arpawong, forskningsassistent professor i gerontologi och chef för Gerontology Bioinformatics Core, strävar efter att samla olika information för att bättre förstå hur genetiska och miljömässiga komponenter interagerar för att resultera i olika hälsoresultat hos äldre vuxna. Hennes nuvarande arbete integrerar användningen av både genomomfattande och tvilling- och familjemodelleringsmetoder från stora datamängder som representerar hundratusentals individer under många decennier, såsom U.S. Health and Retirement Study och Project Talent Aging Study, som båda sträcker sig över decennier av uppföljning med tiotusentals deltagare.
Arpawong säger att studier av åldrande är unikt inom hälsoforskningsområdet eftersom det är så mycket som händer tidigt i livet som påverkar en persons bana senare.
"Jag tar ett livslångt utvecklingssätt för att studera effekter av tidigare livsvillkor på hälsa senare i livet, inklusive genetik, beteenden och kontextuella faktorer som socioekonomisk status och familjemotgångar, " hon säger, "och detta kräver att man sätter ihop många databitar."
Arbeta med projekt som att skapa ett skörhetsindex, utveckla en genomgående genomsökning för depressiv symptomologi hos äldre vuxna, att beräkna hur genetiska och miljömässiga faktorer bidrar till åldringsrelaterade kognitiva förändringar och att bedöma stabiliteten hos MRT-markörer för demens kräver mycket kompetens inom olika områden — och samarbete. Det finns ett extra lager av komplexitet när forskare måste översätta resultat från djurstudier av genetiska markörer till människor.
"Fokus för mitt arbete med Bioinformatics Core är översättningen, eller samarbeta med människor om översättningen, av deras resultat från modellsystem som möss i människobefolkningsdata, säger Arpawong.
Det är lite av en cirkulär process:Ofta, forskarna använder data från människor för att titta på effekterna av resultaten från djurmodellsystemen. När de väl hittar några saker i mänskliga data, de cirklar tillbaka och kör dessa experiment i djurmodellerna för att se om det finns några orsaksmekanismer. Denna datadrivna utforskning öppnar upp för många nya sätt att förstå åldrande, eftersom det inte är möjligt att göra dessa typer av translationella och integrativa gerontologistudier enbart på människor, med tanke på vår långa livslängd och vitt skilda livsmiljöer.
"[Den här översättningen] har blivit en större del av arbetet här inom gerontologi som har varit fascinerande och som hjälper till att accelerera forskningsresultaten över discipliner som traditionellt har fungerat mer självständigt, " säger Arpawong.
Arbetet har blivit naturligt samarbete, involverar många olika utredare med olika bakgrund.
"Det finns mycket crossover på olika avdelningar och flera fördelar med att arbeta med folk från Dornsife College, Keck School of Medicine och Information Sciences Institute, inklusive från psykologi till beräkningsbiologi, "förklarar Arpawong." Det är verkligen en trasslig webb över hela USC. Det pekar bara på hela den transdisciplinära karaktären av detta arbete. Du måste prata med och arbeta med många människor för att se till att du rör dig i rätt riktning."
Arpawong använde nyligen olika datamängder för att hitta sambandet mellan genetik och verbalt minne. Hon fann att en genetisk markör för Alzheimers sjukdom inte var ensam – det finns en andra gen som spelar en roll specifikt i effekter på åldrande-relaterad minnesförmåga.
Big data har också förändrat hur människor samarbetar, säger Eileen Crimmins, USC University Professor och AARP professor i gerontologi. Ingen enskild forskare kan känna till alla delar av ett projekt, förklarar hon.
"Det finns många fler stora multidisciplinära grupper där alla har en specialisering och ingen kan allt, " säger hon. "Så det finns mycket mer av att lita på folk att de vet det och att de kan göra det rätt."
All denna data kräver nyare lösningar för att bostad och överföra den, speciellt när man arbetar med olika forskare runt om i världen.
"Skalan är mycket större i vad vi har att göra med och [i] frekvensen och behovet av att överföra dessa saker, upprätthålla datasäkerhet, och sedan ha verktygen tillgängliga för att göra detta, "säger Arpawong." Mycket av dataanalysen som vi behöver göra kräver kodning på olika programmeringsspråk som vissa av de vanligare statistiska programvarorna inte har kapacitet för, och inhysa data på sätt som går utöver ens egen hårddisk."
Utbildning måste också matcha den senaste utvecklingen inom big data science, kräver att eleverna är kodningskunniga, datadriven och kan ställa nya frågor om vetenskapen om åldrande. Big data har förändrat spelet för doktorander, säger Crimmins, som leder Multidisciplinary Research Training in Gerontology Program vid USC Leonard Davis School. Programmet hjälper predoktorala och postdoktorala studenter att bekanta sig med studiet av åldrande inom flera discipliner.
"Det finns mycket mer tvärvetenskaplig verksamhet eftersom frågorna verkligen har flyttat, "Förklarar Crimmins.
Dagens elever får ständigt nya färdigheter och kunskaper, från luftföroreningarnas patologi till genetik, utöver sina grundstudier i gerontologi. Mycket av det folk gör är att lära sig på jobbet för att få de färdigheter som inte lärs ut i klassrummet, tillägger Arpawong.
För studenter som kommer in på fältet, att förstå statistik och ha ett starkt grepp om räknekunskap är avgörande. I hennes klass, Jacobson presenterar några "konstiga data" - till exempel, varför genomsnittet av en datauppsättning kan vara mycket högre än medianen.
"Om du tänker på genomsnittlig inkomst i USA i motsats till median, som kan säga oss något om amerikaner överlag, " säger hon. "I någon mening, den stora data som är tillgänglig borde tvinga oss att gå tillbaka till grunderna och se grunderna."
Kodningskompetens är också kärnan i de verktyg som nya forskare använder inom området – och ibland kräver det kodning på flera språk.
Justerar för framtiden
Tillgängligheten och datatyperna kommer bara att öka i framtiden, och forskare funderar på hur de kan anpassa sina studier för att ge plats åt ny information. Crimmins är en medutredare för Health and Retirement Study, som har pågått i cirka 30 år. Studien genomförs vartannat år, hälften personligen och hälften i telefon. Sedan 2006, forskarna har samlat in biomarkörer från personer de besöker personligen – mätvärden som vikt och längd, blodtryck och ett blodprov.
Dessa mätvärden kommer att göra det möjligt för forskarna att göra större associationer i befintlig data - och de överskuggar också andra data i analysen. "Två miljoner markörer för varje person, och vi har 20, 000 personer i studien, "Säger Crimmins." Det kräver verkligen datorer med hög kapacitet. "
Med hjälp av data från Health and Retirement Study, Crimmins har gjort flera överraskande fynd. En är att människor faktiskt har fler år av god hjärnhälsa efter 65 års ålder än vad som var fallet tidigare. En annan studie av data visade att utbildning ger människor ett försprång under deras senare år, hjälpa dem att hålla demenssjukdomen borta och deras minnen intakta. Att samla in biomarkörer från studiedeltagare möjliggjorde också USC Leonard Davis alumn Morgan Levine '08, Ph.D. '15 och Crimmins för att utveckla en lovande metod för att mäta biologiska, i motsats till kronologisk, ålder. Deras arbete resulterade i fynd som visar att amerikaner kan åldras långsammare än för två decennier sedan.
USC har framstått som ett dataproducerande universitet. Mycket arbete går till att uppmuntra användningen av data genom att göra dem tillgängliga och i ett användbart format, säger Crimmins. Det utgör en stor del av det hon gör:att göra service för det större fältet.
"Det är lite förväntat inom vårt område för oss som är dataproducenter, vilket är en stor sak här på USC eftersom vi producerar många av de internationella datamängderna, " hon säger.
Big data bryter ner traditionella gränser mellan fält, säger Arpawong. De starkaste resultaten kommer sannolikt från en sammanblandning av olika datatyper – till exempel, medicinsk fakturering och bildbehandling, eller genomik och miljödata.
"Du måste dela upp det i bitar. Du behöver människor som vet hur man manipulerar data för att få det du vill ha - och det är väldigt nyanserat för varje bit, " säger hon. "Du kan få resultat på vilket sätt du kan koda något, men stämmer det? Och en stor fråga för bioinformatik är att se till att människor är utbildade i dessa typer av dataresurser för att se till att de gör vad de vill göra."
USC Leonard Davis School Dekan Pinchas Cohen håller med om att i dagens moderna forskningsmiljö, att utnyttja data från en mängd olika källor är lika viktigt som att förstå cellulära funktioner. I sitt eget labb, han leder big data-drivna studier för att identifiera tidigare okända mitokondriella gener, arbetar för att förstå deras funktioner och om de kan vara måltavlor för behandlingar av Alzheimers, diabetes och andra sjukdomar.
"Istället för ett tänkesätt som passar alla, Big data-åldern tillåter oss att ha en 2000-talsstrategi för att ta itu med sjukdomsrisker och främja hälsosamt åldrande med en djup förståelse för en individs riskfaktorer, " Cohen säger. "Vetenskap handlar inte längre om att titta in i ett mikroskop i ens eget labb; det handlar om att se utåt till data från miljontals människor över hela världen."