Ny maskininlärningsalgoritm kan förutsäga ålder och kön från bara din Twitter -profil. Kredit:Shutterstock
Ett nytt "demografiskt inferens" -verktyg utvecklat av akademiker kan göra förutsägelser som enbart baseras på informationen i en persons sociala medieprofil (dvs. skärmnamn, biografi, profilbild, och namn). Verktyget – som fungerar på 32 språk – kan bana väg för att åsikter som uttrycks på sociala medier kan tas med i populära undersökningsmetoder.
Forskare vid University of Oxford, Michigans universitet, University of Massachusetts, GESIS – Leibniz Institutet för Samhällsvetenskap, Max Planck-institutet, och Stanford University har utvecklat en metod för att härleda information om en ägare av ett socialt mediekonto baserat på informationen som avslöjas i deras Twitter-profilinformation.
Ett nytt maskininlärningssystem - som presenterades på webbkonferensen i San Francisco i veckan - lärde sig mönster som är förknippade med olika åldrar, kön, och mellan organisationer och individer från en datauppsättning med över fyra miljoner Twitter -konton på 32 språk. Denna information kombinerades sedan med uppskattade platser och viktades om mot folkräkningsdata för att producera mer exakta uppskattningar av befolkningen i 1, 101 statistiska regioner i hela EU.
Detta skulle kunna bana väg för en mer representativ förståelse av människors åsikter om viktiga samhällsfrågor och ämnen, baserat på vad de lägger ut på sociala medier och tillskrivs specifika geografiska platser och demografiska grupper.
Dr Scott Hale, Senior forskare, Oxford Internet Institute, University of Oxford sa:"Trots att det finns massor av datapunkter, sociala medier har länge varit ett opålitligt verktyg för att förstå vilka frågor som är viktigast för en bredare befolkning med tanke på hur människor själv väljer att använda en plattform.
"Denna första studie av sitt slag utför demografiska förutsägelser om ägaren av ett socialt mediekonto enbart baserat på kontots profilinformation på 32 språk och viktar sedan om onlineprovet för att vara mer likt en offlinepopulation.
"Vi ser detta som ett viktigt steg mot att använda sociala medier för att få en mer exakt bild av de frågor och ämnen som mest intresserar allmänheten och förstå vilka gruppers åsikter som är över- eller underrepresenterade."
Denna information och data som ligger till grund för denna forskning har gjorts tillgänglig i ett bibliotek med öppen källkod och du kan testa slutsatsverktyget på www.euagendas.org/m3demo