• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Forskare utvecklar ett nytt system med öppen källkod för att hantera och dela komplexa datauppsättningar

    Forskare har skapat ett nytt datahanteringssystem med öppen källkod för forskare, med hopp om att systemet kan göra samarbetet lättare. Kredit:Markus Spiske på Unsplash

    Data är ofta kärnan i vetenskapen – forskare spårar hastigheter, mät ljus som kommer från stjärnor, analysera hjärtfrekvenser och kolesterolnivåer och skanna den mänskliga hjärnan efter elektriska impulser.

    Men ofta, dela denna data med andra forskare – eller med peer-reviewed tidskriftsredaktörer, eller finansiärer—är svårt. Programvaran kan vara proprietär, och oöverkomligt dyra att köpa. Det kan ta år av träning för en person att kunna hantera och förstå programvaran. Eller så kan företaget som skapade programvaran ha gått i konkurs.

    Ett forskarlag har utvecklat ett datahanteringssystem med öppen källkod som forskarna hoppas ska lösa alla dessa problem. Forskarna beskrev sitt system i dag i tidskriften PLOS ETT .

    "Vi ville skapa ett filformat och en datauppsättningsmodell som skulle kapsla in de flesta datauppsättningar vi arbetar med, på alla instrument i ett labb, sa Philip Grandinetti, professor i kemi vid Ohio State University och senior författare till tidningen. "Det finns ett långvarigt problem, genomgående bland forskare, att du köper ett instrument för flera miljoner dollar och företagen som tillverkar det instrumentet har sitt eget proprietära format, och det är en mardröm att dela med någon annan."

    Stora datamängder är svåra att dela, delvis för att programvara ofta är proprietär, men också delvis för att filerna ofta är så stora att de är svåra att dela i ett e-postmeddelande eller via en molnbaserad server. Och även om filerna kan exporteras som en filtyp som kan delas, Viktig metadata – de saker som förklarar vad datasetet faktiskt är – går ofta förlorade.

    Deras system, som Grandinetti och kollegor kallade "Core Scientific Data Model, " är utformad för att enkelt dela komplexa datauppsättningar, utan stora filer som tar upp mycket bandbredd och hårddiskutrymme, och utan att förlora metadata. Tänk på en datauppsättning som inkluderar lufttemperatur, lufttryck, vindhastighet och solflöde – det här systemet kan hantera det. Eller överväg måtten och färgen på ett ljus som kommer från en stjärna i en avlägsen galax - det här systemet kan hantera det.

    "Du behöver en datauppsättning som är otroligt flexibel i sin förmåga att hålla alla dessa saker i ett filformat utan att förlora information, ", sa Grandinetti. "Så tanken är att vi skapade en modell som vi trodde var tillräckligt flexibel för att göra det."

    Ohio State University-teamet, i samarbete med professor Thomas Vosegaard vid universitetet i Aarhus i Danmark, och Dr Dominique Massiot vid universitetet i Orléans i Frankrike, byggd programvara som kan köras på en Mac eller PC. De laddade upp den till webben och gjorde koden öppen källkod (vilket betyder att alla kan titta på den, Använd den, och ladda ner den gratis.) Publikationen i PLOS ETT är avsiktlig:Tidskriften är också tillgänglig för alla, gratis.

    Och, forskarna hoppas, systemet kan vara enkelt, gratis sätt att kombinera flera typer av data på en plats.

    "Vi studerar flera datamängder som vetenskapsmän - och som vetenskapsman själv, Jag skulle vilja kunna hämta data från alla dessa filer och sätta ihop dem på ett sätt som jag kan arbeta med, " sa Deepansh Srivastava, en postdoktor i Grandinettis grupp.

    "Istället för att leta efter data och plocka den från datauppsättningar, om vi helt enkelt kunde exportera den som denna enda filtyp – som en grundläggande vetenskaplig datafiltyp – skulle vi kunna arbeta i ett gemensamt system."


    © Vetenskap https://sv.scienceaq.com