Upphovsman:CC0 Public Domain
Allmänheten och den stora mängden data som genereras idag ger experter på i stort sett alla domäner riklig information för att spåra allt från finansiella trender, utrymningsvägar för katastrofer, och gatutrafik, till djurvandringar, vädermönster, och sjukdomsvektorer. Men att använda dessa data för att bygga visualiseringar av komplexa prediktiva modeller med maskininlärning är en utmaning för experter som saknar nödvändiga datavetenskapliga färdigheter.
Ett team vid NYU Tandon School of Engineering Visualization and Data Analytics (VIDA) lab, ledd av Claudio Silva, professor vid institutionen för datavetenskap och teknik, utvecklat ett ramverk som heter VisFlow, genom vilka de som kanske inte är experter på maskininlärning kan skapa mycket flexibla datavisualiseringar från nästan alla data. Vidare, laget gjorde det enklare och mer intuitivt att redigera dessa modeller genom att utveckla en förlängning av VisFlow som heter FlowSense, vilket gör det möjligt för användare att syntetisera datautforskningsledningar via ett naturligt språkgränssnitt.
Forskningen, "FlowSense:A Natural Language Interface for Visual Data Exploration with a Dataflow System" vann priset för bästa papper vid årets IEEE-konferens om Visual Analytics Science and Technology (VAST).
På tisdag, 22 oktober, Bowen Yu, som tog sin doktorsexamen vid NYU Tandon under Silva, kommer att presentera uppsatsen vid den inledande plenarsessionen av IEEE Visualization Conference (IEEE VIS) i Vancouver, British Columbia. Studien är en av flera artiklar som belyser VIDA -forskning som kommer att presenteras på IEEE VIS, den ledande platsen för visualiseringsforskning och en främsta konferens för datorgrafik.
På konferensen, samarbetspartners med VIDA, som har etablerat sig som ett ledande forskningscentrum för datavisualisering, kommer att presentera visualiseringsmodelleringsprojekt med applikationer inom astronomi, medicin, och klimatforskning utvecklad vid eller med centrum:
VisFlow, introducerades 2017 och finansieras delvis av Defense Advanced Research Projects Agency's Data Driven Discovery of Models-programmet är ett webbaserat ramverk som låter användaren använda enkla dra-och-släpp-åtgärder för att enkelt interagera med data, låta användare skapa visuella datamodeller baserade på tidsserier, nätverk, geografiska platser, och mer, som alla kan formas till en kompakt och interaktiv visualiseringspanel.
Yu sa att FlowSense tar dessa funktioner ett steg längre. "Tänk om man bara kunde tala eller skriva en mening för att aktivera ett dataflödesdiagram, "sa han." Denna förmåga skulle göra icke-experter mer bekväma användare, samtidigt som de ger erfarna användare genvägar. Vi tror att med naturligt språkstöd kan vi mildra inlärningskurvan för ett sådant system och göra dataflödet mer tillgängligt, säger han.
Silva, en IEEE -stipendiat som är ansluten till NYU:s Courant Institute for Mathematical Sciences, Centrum för datavetenskap, Center for Urban Science and Progress, och Center for Advanced Technology in Telecommunications, Lagt till, "Vi erbjuder VisFlow och FlowSense som öppen källkod, gratis-till-alla kodbaserade ramverk på github, som ett sätt att motivera vidareutveckling för visualiseringsändamål. Det finns verkligen mycket mer forskning som kan göras på detta område, och det är min förhoppning att FlowSense kommer att vara en stor stimulans för mer samarbete för att göra dataflödessystem mer flexibla, lätt att använda, och populärt bland dataanalytiker. "