Visualisering med hjälp av HyperTools för att representera innehållet i Wikipedia-artiklar. Varje punkt representerar en enda Wikipedia-artikel (från en uppsättning av 3, 000 slumpmässigt valda artiklar). Punktpositionerna återspeglar vad artiklarna handlar om (prickarna i närheten handlar om liknande ämnen), och prickfärgerna återspeglar automatiskt upptäckta "kluster" av artiklar som handlar om liknande teman. Kredit:Statisk bild av Contextual Dynamics Laboratory, Dartmouth College
Varje datauppsättning i det observerbara universum har en grundläggande geometri eller form, men den strukturen kan vara mycket komplicerad. För att göra det lättare att visualisera komplicerade datauppsättningar, ett forskarteam från Dartmouth har skapat HyperTools – ett mjukvarupaket med öppen källkod som utnyttjar en svit av matematiska tekniker för att få intuitioner om högdimensionella datauppsättningar genom de underliggande geometriska strukturerna de speglar. Resultaten publiceras i Journal of Machine Learning Research .
HyperTools kan användas för att omvandla data till visualiserbara former eller animationer, som kan användas för att:jämföra olika datamängder, få insikter i underliggande mönster på ett intuitivt sätt, göra generaliseringar över datauppsättningar, och utveckla och testa teorier som rör Big Data.
"Datauppsättningarna vi ställs inför som moderna vetenskapsmän kan vara enormt komplexa, ofta återspeglar många interagerande komponenter, " förklarar senior författare, Jeremy R. Manning, en biträdande professor i psykologi och hjärnvetenskap och chef för Contextual Dynamics Lab i Dartmouth. "Vårt verktyg förvandlar komplex data till intuitiva 3D-former som kan granskas visuellt och jämföras. vi utnyttjar det visuella systemets fantastiska förmåga att hitta mönster i världen omkring oss för att också hitta mönster i komplexa vetenskapliga data."
Forskarna visar hur HyperTools kan tillämpas på olika typer av data. I tidningen, de visar upp visualiseringar av:hjärnaktivitet, filmrutor och hjärnans reaktioner på att titta på dessa bildrutor; förändringar i temperaturmätningar över jordens yta från 1875 till 2013; och det tematiska innehållet i politiska tweets utfärdade av Hillary Clinton och Donald Trump under den amerikanska presidentkampanjen 2016.
HyperTools genererade visualisering av förändrade temperaturer över jordens yta från 1875-2013. Visualisering belyser den cykliska (säsongsmässiga) karaktären hos globala temperaturer som sker tillsammans med en gradvis ökning av globala temperaturer över tiden. Bilden är bland de som ingår i figur 1 i tidskriftsartikeln. Kredit:Statisk bild av Contextual Dynamics Laboratory, Dartmouth College.
Förutom att använda HyperTools för att direkt förstå den geometriska strukturen av data, de insikter som avslöjas av verktyget kan också användas för att vägleda utvecklingen av maskininlärningsalgoritmer. Till exempel, datavisualiseringarna kan avslöja hur olika typer av observationer bildar strukturerade distinkta kluster (t.ex. Trump-tweets vs Clinton-tweets) som kan användas för att förstå likheterna och skillnaderna mellan grupper.
Som en del av HyperTools verktygslådan, Mannings labb fortsätter att utveckla och släppa andra typer av geometriska visualiseringsanalyser, inklusive de nyligen lanserade textanalyserna.
Visualisering med hjälp av HyperTools för att representera innehållet i tidskriftsartiklar. Varje prick representerar ett enda dokument publicerat i Neural Information Processing Systems (NIPS). Punktpositionerna återspeglar vad tidningarna handlar om (prickarna i närheten handlar om liknande ämnen), och prickfärgerna återspeglar automatiskt upptäckta "kluster" av papper som handlar om liknande teman. Kredit:Contextual Dynamics Laboratory, Dartmouth College.
3D-animering av en visualisering med hjälp av HyperTools för att representera innehållet i Wikipedia-artiklar. Kredit:Contextual Dynamics Laboratory, Dartmouth College