Grafisk bild av återanvändning av data. Kredit:Kroon-Batenburg et al.
Det allt populärare ämnet för avsättning av rådiffraktionsdata undersöks i en Topical Review i IUCrJ . Bygger på 2015 års workshop som anordnades av IUCr Diffraction Data Deposition Working Group (DDDWG), författarna uppdaterar berättelsen med redogörelser för nya ämnesspecifika och institutionella dataförråd, och av ett växande politiskt tryck på hantering av forskningsdata, såsom European Open Science-initiativet.
Artikeln är, dock, mer än bara en workshoprapport eller en undersökning av en policy som utvecklas. Den syftar till att informera kostnads-nytto-argumenten över diffraktionsdataavsättning med exempel från verklig frontlinjeforskning. Till exempel, Kroon-Batenburg och Helliwell har samarbetat i studier av proteinbindning av det kemoterapeutiska medlet cisplatin, och har gjort alla sina 34 rådatauppsättningar tillgängliga via University of Manchester Data Library. Några av dessa datauppsättningar har analyserats om och resulterat i ny förståelse av cisplatin-lysozymmodeller.
Möjligheten att extrahera ytterligare information från arkiverade primära datamängder på detta sätt (antingen genom insikter från nya ögonpar eller genom efterföljande förbättringar av mjukvaruanalys) har konsekvenser för strukturella databaser, underlätta idén om kontinuerlig förbättring av studierna, såsom för makromolekylära strukturmodeller (länge förkämpat av Terwilliger).
Det är inte bara inom området för bestämning av makromolekylär struktur som dessa överväganden är viktiga. En av de största utmaningarna med att återanvända rådata är behovet av fullständig metadata kopplad till vilken rådatauppsättning som helst, för att tillåta dess efterföljande tolkning och fullständig utvärdering.
Olika IUCr-kommissioner publicerar aktivt sina sammanfattningar av de väsentliga metadata som behöver samlas in tillsammans med alla experimentella datauppsättningar. Dessa initiativ och deras förhållande till IUCrs standard för datakarakterisering (CIF, det kristallografiska informationsramverket) granskas i artikeln. På nytt, praktiska tips ges till viktiga metadata som måste fångas in tillsammans med diffraktionsdatauppsättningar.
Även om det finns uppmuntrande tecken på att forskarvärlden visar ett mer välgrundat intresse för datahantering och dess vetenskapliga potential, nya utmaningar ställs av den senaste generationens instrumentering, kan generera enorma mängder data i en otrolig hastighet. Det kanske inte går att arkivera eller ens noggrant analysera all data som produceras. Dock, den här artikeln kommer att bidra till att ge en djup förståelse av skälen till varför samhället bör investera ansträngningar och resurser för att utvinna största möjliga värde från datafloden, i kristallografi som i vilken vetenskap som helst.