Ibland är det bästa med att läsa en vetenskaplig artikel ett oväntat ögonblick av erkännande – inte inom vetenskapen, men i forskarnas mänsklighet. Det är betryggande på ett sätt att hitta små avvikelser från den stabila vetenskapliga formeln:en anteckning som faller utanför den förväntade syntaxen för abstrakt-introduktion-metoder-resultat-diskussion. Som en tidig karriärforskare som är mycket mitt uppe i att skulptera avhandlingskapitel till manuskript, det är trevligt att komma ihåg att #365-tidningarna jag läser är produkter av författare som, som jag, kämpade sig igenom revideringar och goofade med medförfattare och hittade dyster humor i de mörka stunderna.
Ekologibloggar, Twitter, och de bredare medierna älskar också att notera de nyckfulla titlarna, roliga (och allvarliga) erkännanden, minnesvärda figurer, och unika bestämningar av medförfattarskapsordning som har dykt upp på sidorna i vetenskapliga tidskrifter. Jag tycker om att snubbla över dessa stunder av lättsinne i min TO READ-fil; förra våren förhalade jag formateringen av min avhandling genom att ivrig läsa avsnittet Acknowledgements för alla som jag till och med vagt hade överlappat med i min doktorsexamen. program. Ett ställe jag inte har tänkt att leta efter slumpmässig vetenskapshumor:Datatillgänglighetsförklaringen. Som det visar sig, Jag har saknat en intressant historia.
Ett färskt PLOS ONE-dokument syftade till att analysera datatillgänglighetsutlåtandena för nästan 50, 000 senaste PLOS ONE-papper. Detta kan låta som ett tråkigt ämne, men Lisa Federer och medförfattarnas arbete är förvånansvärt engagerande, aktuell, och tankeväckande. I mars 2014 presenterade PLOS en datapolicy som kräver att forskningsartiklar ska inkludera ett datatillgänglighetsuttalande som ger läsarna information om hur man får tillgång till relevant information för varje artikel. Men, som Federer et al påpekar ""tillgänglighet" kan tolkas på sätt som har väldigt olika praktiska resultat när det gäller vem som kan komma åt data och hur."
Varför spelar datatillgänglighetsförklaringar någon roll? Inom ekologi, Förespråkare för öppen data talar för reproducerbarhet och återanvändning. Så många av oss arbetar med små studieområden och samlar ihop isolerade kalkylblad med data, och sedan publicera på vårt system, kanske kasta en delmängd av den data vi samlat in i en kompletterande fil. Men stora bildfrågor som ser över skalor, ekosystem, och tillvägagångssätt förlitar sig på big data – och big data är ofta ett amalgam av många små datamängder från ett brett spektrum av forskare. Små (eller valfri storlek) datauppsättningar som är allmänt tillgängliga, och lätt att komma åt i datalager istället för gamla labb-anteckningsböcker eller nedlagda labbdatorer, är mycket mer benägna att ha ben, för att återanvändas och testas igen, och bidra till fältet i stort.
Kredit:Eric Heupel, https://www.flickr.com/photos/eclectic-echoes/
Medan PLOS var i framkant av datatillgänglighetsuttalanden bland peer-reviewed tidskrifter, Federers granskning av innehållet i dessa datatillgänglighetsförklaringar gör det klart att vi ännu inte befinner oss i den lysande framtiden för Open Data. PLOS datatillgänglighetspolicy "rekommenderar starkt" att data deponeras i ett offentligt arkiv; Federer fann att endast 18,2% av PLOS papper namngav ett specifikt arkiv eller källa där data fanns tillgänglig. De flesta uttalanden om datatillgänglighet hänvisar läsaren till själva tidningen eller kompletterande information. Även bland artiklarna i dataförrådet, vissa datatillgänglighetsuttalanden angav ett arkiv men misslyckades med att inkludera en URL, DOI, eller åtkomstnummer – i princip skickar läsare på vilda vägar för att lokalisera sina data i förvaret.
Andra uttalanden verkar ha angetts som platshållare, potentiellt avsedd att ersättas vid publicering av artikeln, som "Alla rådata är tillgängliga från XXX [sic]-databasen (accessnummer(n) XXX, XXX [sic])" eller "Data och hela uppsättningen experimentella instruktioner från denna studie finns på
Dessa exempel på platshållare som gjorde det till publicering är pinsamma, men mänsklig, och som Federer påpekar, Uttalanden om datatillgänglighet bör granskas av redaktörer och referentgranskare med samma granskning som vi tillämpar på studiedesign, Statistiska analyser, och citat.
Jag har arbetat med metaanalyser och projekt som är beroende av data från befintliga digitala arkiv. Frustrationen av att jaga efter kompletterande information, Dryad DOI, och GitHub-adresser bara för att hitta en återvändsgränd eller en trasig motsvarande författares e-postadress är en känsla som liknar jordekorrar som tuggar genom temperaturlogger-ledningar halvvägs genom fältsäsongen. Federer noterar att tidvattnet vänder mot öppna data:efter en stenig start 2014 — Federers team analyserade många artiklar som troligen lämnats in innan (men publicerades efter) policyn för datatillgänglighet trädde i kraft — 2015 och 2016 sågs procenten av artiklarna som saknade en Datatillgänglighetsförklaringen minskar dramatiskt. Under samma tidsperiod, Federer noterar en liten ökning av antalet uttalanden som hänvisar till data i ett arkiv och färre som hävdar att data finns i tidningen eller - rysning - tillgänglig på begäran.
På en bredare nivå, öppna data är ett nyligen politiserat ämne. EPA föreslog nyligen nya standarder som skulle förbjuda vetenskapliga studier från att informera regulatoriska ändamål om inte all rådata var allmänt tillgänglig offentligt och kunde reproduceras. Detta är inte så mycket en guldstandard som en gag-regel. I en PLOS-redaktion, John P. A. Ioannidis påpekar att samtidigt som man "gör vetenskapliga data, metoder, protokoll, programvara, och skript som är allmänt tillgängliga är en spännande, värdig strävan" för att eliminera allt utom så kallad perfekt vetenskap från regleringsprocessen, EPA åtar sig att fatta beslut som "beroende unikt på åsikter och infall." De flesta av rådata från tidigare studier är inte offentligt tillgängliga - och som Federers forskning visar, även i en ålder av obligatoriska uppgifter om datatillgänglighet, öppna data är fortfarande ett pågående arbete. Och så slog vi på – forskare mot vetenskapsfientliga Environmental Protection Agency-administratörer, oavbrutet återbetalas till stöd för publicering tillgänglig, öppna data som ett slags grönt ljus för tidigare forskning.
Den här historien återpubliceras med tillstånd av PLOS Blogs:blogs.plos.org.