• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Muddring av datasjön

    Upphovsman:CC0 Public Domain

    Datasjöar gör att information kan läggas till i ett system utan förbehandling eller modellering. Kontrastera detta med en konventionell databas där data måste levereras på ett mycket mer förfinat och formellt sätt. Således erbjuder en datasjö mycket snabbare inmatningshastighet. Dock, som forskning från Brasilien visar, även om en datasjö bevarar högsta granularitetsnivå för data, att användbar flexibilitet också kan vara problematisk. "Om det inte hanteras, det är lätt att tappa kontrollen över förvaret på grund av volymen det rymmer och dess tillväxt, "förklarar laget.

    Forskarna förklarar vidare att datasjöar inte innehåller någon av semantiken i en konventionell databas, men även om detta kan vara fördelaktigt för att undvika vissa typer av partiskhet vid omextrahering och analys av dagar, det betyder att förståelsen av innehållet i datasjön kan bli en ganska besvärlig uppgift. Detta, föreslår laget, har kanske underminerat den utbredda tillämpningen och användningen av datasjöar inom företagsmiljön och stammat acceptansen av detta användbara verktyg på grund av vissa missuppfattningar om hur de kan användas i datavetenskapliga insatser.

    Teamet har nu använt sig av kunskapshanteringsmodeller för att hjälpa dem att ta itu med de problem som är förknippade med data lake -användning och för att berika den data som flyter in för att förbättra informationsanvändbarheten. De tillägger också att genom att använda en dataportalplattform och tillhörande metadata menar de att deras tillvägagångssätt skulle ge enkel åtkomst till datasjön som upprätthåller och ökar dess användbarhet och förhindrar dess nedbrytning till ett så kallat datasump.


    © Vetenskap https://sv.scienceaq.com