Kredit:George Rudy, Shutterstock
Big Data är en så enorm förändring för företag att det lätt kan verka överväldigande. BigDataEurope-projektet möter intresserade företag halvvägs genom att tillhandahålla en integrerad hög med verktyg för att manipulera, publicera och använda storskaliga dataresurser.
Ser man på den mycket långa listan över projekt som finansieras under Horisont 2020 och det stora spektrum av ämnen som behandlas, det skulle vara lätt att glömma att EU:s största forsknings- och innovationsprogram hittills handlar om att ta itu med sju stora samhällsproblem:hälsa och välbefinnande; mat, jordbruk och bioekonomi; energi; transport; klimatförändring; frihet och säkerhet; och Europas plats i en föränderlig värld.
Vad som är ännu lättare att glömma är det faktum att dessa till synes väldigt olika ämnen och de relaterade verksamhetssektorerna alla delar åtminstone ett gemensamt drag:hur de skulle kunna dra nytta av digital innovation, och mer specifikt från Big Data.
För att säkerställa att de gör det, BigDataEurope (Integrating Big Data, Projektet Software and Communities for Addressing Europe's Societal Challenges) skapade sju gemenskaper och försökte bättre förstå vad de skulle behöva av Big Data. Resultatet är en plattform som kan ta in data från en mängd olika källor, som kan skräddarsys för att inrikta sig på innovativa applikationer över de sju H2020-utmaningarna.
Vilka luckor ville du fylla med det här projektet och hur är detta viktigt?
Det är allmänt erkänt att analysen av stora mängder data (Big Data) djupt påverkar vår ekonomi och samhället som helhet. Dock, det är viktigt att motsvarande teknologier inte bara är tillgängliga för en liten krets av företag, men kan också användas i stor utsträckning av mindre företag och initiativ samt inom forskning och akademi.
BigDataEurope fyllde denna lucka först genom att tillhandahålla en plattform för att realisera Big Data-applikationer, och sedan genom att diskutera krav och pilotansökningar med samhällen som representerar de samhälleliga utmaningar som identifierats av ramprogrammet H2020.
Vad gör ditt tillvägagångssätt innovativt?
Många evenemang organiserade med intressentgrupper fick oss att inse att förutom volym och hastighet, mångfalden av data är en nyckelaspekt att hantera i samhälleliga tillämpningar.
För att möta detta krav, vi utarbetade och producerade ett semantiskt databeskrivningsskikt för Big Data. Detta lager använder ordförråd och kunskapsgrafer, och gör det möjligt för samhällen att utveckla en gemensam förståelse av sina data samtidigt som de sammanlänkar och integrerar dessa data på en teknisk nivå.
Vilka var de största svårigheterna du mötte med att föra samman alla dessa intressentgrupper och datakällor, och hur övervann du dem?
En viktig utmaning låg i de olika terminologierna, kulturer och praxis som finns i intressentgrupper, vilket också resulterade i väldigt olika krav och synpunkter. Medan, till exempel, öppen data spelar redan en nyckelroll i mobilitetstillämpningar, datasäkerhet, integritet och anonymisering är av största vikt i vårdscenarier.
Vi tog oss an denna utmaning genom att undvika att utveckla en plattform som passar alla, istället integrera komponenter som fyller ett mycket specifikt syfte såsom bearbetning av strömmande data eller anonymisering. Som ett resultat, användaren kan kombinera och integrera de mest lämpliga datahanteringskomponenterna för alla konkreta applikationsscenarier på BigDataEurope -plattformen.
Vilka är fördelarna med att integrera all denna data? Kan du ge ett verkligt exempel?
Projektet tog fram sju demonstratorer som visade upp värdet av integrerad data för de olika samhällsutmaningarna. Dessa inkluderade till exempel prognoser av vägtrafik och trängsel baserat på historiska och aktuella sensordata i kombination med information från sociala nätverk.
Ett annat exempel är precisionsodling som syftar till att ge växter som vinrankor optimal näring, gödsling och bevattning baserad på klimat- och forskningsdata.
Motsvarade projektresultaten dina initiala förväntningar? Hur så?
Övergripande var behovet av att hantera dataskillnader något vi förväntade oss och bekräftades genom intressent- och samhällsmöten. Tack vare den semantiska integrationsstrategin som följs av plattformen, vi lyckades ta ett steg framåt, men vi är fortfarande lite ifrån visionen att sömlöst integrera och analysera stora mängder aggregerad data med minimal ansträngning. Förutom, hänsyn till dataskydd och dataleverantörers suveränitet kommer att kräva mer uppmärksamhet i framtiden.
Hur kan intresserade intressenter börja använda din plattform?
Plattformen, dokumentationen och pilotimplementeringarna är helt öppen källkod och tillgängliga för återanvändning. Också, det finns ett antal av BigDataEurope -konsortiets partner (inklusive till exempel Fraunhofer) som är redo att ge hjälp och stöd.
Vilka är dina uppföljningsplaner?
Konsortiets medlemmar forskar kring ämnet Big Data-hantering inom sina egna domäner. Till exempel, Det finns redan flera nyligen startade H2020-projekt som fortsätter att underhålla delar av BigDataEurope-plattformen och fördjupa dess tillämpning inom hälso- och sjukvårds- och life-science-domänerna.