Geokemister använder IEDA -data i sin forskning och bidrar till dess växande databaser. Kredit:Lamont-Doherty Earth Observatory
De flesta forskningsdatabaser är snävt fokuserade. De kan endast innehålla seismiska data från jordbävningar, till exempel, eller kemiska data från vulkaniska bergarter. Interdisciplinary Earth Data Alliance (IEDA) hade som mål att skapa en annan typ av forskningsupplevelse, och resultatet underblåser banbrytande multidisciplinära upptäckter över hela världen.
Skapad och förvaltad av forskare vid Lamont-Doherty Earth Observatory, IEDA sammanför olika datamängder från geokemi och marin geovetenskap till ett system. Viktigt, den tillhandahåller verktygen som gör det möjligt för forskare från ett brett spektrum av områden att enkelt söka efter och utforska samband mellan många olika typer av data.
"Detta är en ny era av datautvinning, "sade IEDA -direktören Kerstin Lehnert, en geokemist och Doherty Senior Research Scientist på Lamont. Lehnert kommer att leda flera sessioner för att utforska framsteg inom databevarande och lagring den här veckan vid American Geophysical Union's Fall Meeting i San Francisco. Två av dessa sessioner kommer att streamas live online.
"Genom IEDA, forskare kan hitta de naturliga proverna, kompositionen, provernas geokemi. Om du behöver veta strukturen på skorpan under dessa prover, du kan komma till seismiska data. Du kan kontrollera om det finns experimentella resultat för kemisk sammansättning från nära dessa stenar som kan berätta var de kommer ifrån. Finns det några daterade stenar? Var finns geokronologin i just detta område? Data börjar nätverkas, och det kommer ihop i IEDA, sa Lehnert.
Före IEDA, denna typ av data var i stort sett otillgänglig, lagras ofta på forskares lokala datorer, i sina labb-anteckningsböcker, eller fragmenterad i alla vetenskapliga tidskrifter. Genom att föra samman data i ett lätt sökbart format, IEDA har skapat ett sätt för forskare att snabbt komma åt tusentals värden för analys och jämförelse. Två forskare kunde nyligen dokumentera en koppling mellan djup jordgeokemi och en ökning av syre i jordens atmosfär genom att ladda ner 70, 000 prover av kontinental magmatisk bergart från IEDA. Att hitta all data skulle ha tagit år innan IEDA skapades.
"Att integrera olika typer av observationer och observationer från många olika regioner för att få ett globalt perspektiv är ett kraftfullt sätt att få ny inblick i vetenskapsproblem, " sa IEDAs biträdande direktör Suzanne Carbotte, en marin geofysiker och Bruce C. Heezen Lamont forskningsprofessor.
Transforming 21st Century Science
IEDA kombinerar EarthChem, världens största geokemidatabas, med Marine Geoscience Data System, som tillhandahåller data för studier av havsbotten och djupare skorpa- och mantelprocesser.
Marine Geoscience Data Systems högupplösta bilder ger detaljerade vyer av havsfästen som dessa och andra delar av havsbotten. Cirka 8 procent av havsbotten har kartlagts till 100 meters upplösning som denna. Kredit:GeoMapApp
EarthChem startade som petrologidatabasen PetDB i Lamont 1996, när relationsdatabaser precis började utvecklas. Idag innehåller den flera partnerdatabaser och cirka 400, 000 prover och 20 miljoner analytiska värden från hela geokemin, tillsammans med verktygen för att bryta samlingarna. EarthChem-portalen ansluter också till andra stora databaser, inklusive tyska GeoRock, en databas i Japan, och U.S. Geological Survey:s nationella geokemiska databas, så att IEDA-användare kan söka i alla dessa stora databaser samtidigt.
Marine Geoscience Data System spårar sitt ursprung till början av 1990-talet, när Lamont-oceanografen Bill Ryan lanserade en första i sitt slag webbåtkomlig databas med data från havsbotten. Utifrån denna tidiga resurs, Marine Geoscience Data System serverar ett brett utbud av marin geovetenskaplig data som samlas in av forskningsfartyg och andra plattformar, inklusive data tillbaka till 1954. Det inkluderar globala batymetridata, havsbottenbilder, seismiska data som ger tvärsnittsvyer under havsbotten, samt andra multidisciplinära data från en rad nationella forskningsprogram.
IEDA-systemet är också unikt utrustat för att inkludera mindre, nischuppsättningar, som den sedan gör öppen och tillgänglig via interaktiv, kartbaserade gränssnitt och andra verktyg.
Ett fokus är att sammanställa vad som kallas "long-tail"-data:vad forskare gör med observationsdata i sina labb och hur de analyserar det.
"Mycket av det människor gör med olika datamängder i sina labb kan vara mycket innovativt och unikt och nytt, sa Vicki Ferrini, en oceanograf som arbetar med IEDA:s marina geofysiska data. "Allt kommer ut genom vetenskapliga publikationer, tolkningar av det kommer ut, men att faktiskt göra data som stöder dessa publikationer tillgängliga och återanvändbara och till något som kan byggas på är vad vi verkligen strävar efter att göra. "
Förstå forskarnas databehov
En del av IEDA:s framgång härrör från teamets nära kopplingar till vetenskapen. Lehnert, Carbotte, och många av IEDA-teammedlemmarna är forskare som är väl förtrogna med vetenskapliga arbetsflöden och hur forskare söker efter och analyserar data. De vet vad forskare behöver och hur man anpassar lösningar och införlivar olika typer av resultat.
Utöver förvar och analysverktyg, IEDA har identifieringssystem som kopplar publicerade papper till sina originaldata och prover. Öppenhet av data är avgörande för forskarnas förmåga att testa teorier och reproducera resultat, och datahanteringsplaner krävs nu av National Science Foundation, som stöder IEDA. IEDA gör också data och prover tillgängliga för återanvändning så att forskare inte behöver samla in samma typer av data från samma plats igen, spara tid och pengar.
"IEDA bygger på Lamonts rika arv av att skaffa olika multidisciplinära data för att ta itu med vetenskapsfrågor som går tillbaka till Doc Ewings tidigaste dagar och de globalt omfattande expeditionerna med Lamont-skepp, "Sa Carbotte. Maurice" Doc "Ewing, Lamonts grundare, beordrade alla havsexpeditioner att rutinmässigt samla in olika uppsättningar geovetenskap och oceanografiska data. När nya vetenskapliga frågor uppstod, data och prover fanns ofta där för analys.
"Vi gör uppgifterna tillgängliga, och människor kan ta data för vad de behöver, sa Lehnert.
Denna berättelse publiceras på nytt med tillstånd av Earth Institute, Columbia University:blogs.ei.columbia.edu/