Upphovsman:CC0 Public Domain
Tack vare ett givande samarbete mellan språkforskare och specialister på maskininlärning, en ny applikation som utvecklats av forskare vid Östra Finlands universitet och Linnéuniversitetet i Sverige kan upptäcka Twitter -bots oberoende av språket som används.
Under de senaste åren har stora data från olika sociala medieapplikationer har gjort webben till ett användargenererat informationsförråd på ständigt ökande antal områden. På grund av den relativt enkla tillgången till tweets och deras metadata, Twitter har blivit en populär datakälla för undersökningar av ett antal fenomen. Dessa inkluderar, till exempel, olika politiska kampanjer, sociala och politiska omvälvningar, Twitter som ett verktyg för nödkommunikation, och använda sociala medier för att förutsäga börskurser.
Dock, forskning som använder data från sociala mediedata är ofta skev av närvaron av bots. Bots är icke-personliga och automatiserade konton som publicerar innehåll på sociala nätverk online. Twitterens popularitet som ett instrument i offentlig debatt har lett till en situation där det har blivit ett idealiskt mål för spammare och automatiserade skript. Det har uppskattats att cirka 5–10% av alla användare är bots, och att dessa konton genererar cirka 20–25% av alla tweets som läggs ut.
Forskare inom digital humaniora vid Östra Finlands universitet och Linnéuniversitetet i Sverige har utvecklat en ny applikation som bygger på maskininlärning för att upptäcka Twitter -bots. Programmet kan upptäcka autogenererade tweets oberoende av vilket språk som används. Forskarna fångade sammanlagt 15 för analys 000 tweets på finska, Svenska och engelska. Finska och svenska användes främst för utbildning, medan tweets på engelska användes för att utvärdera programmets oberoende språk. Ansökan är lätt, gör det möjligt att snabbt och relativt effektivt klassificera stora mängder data.
"Detta förbättrar datakvaliteten - och ger en mer exakt bild av verkligheten, "Professor i engelska Mikko Laitinen från Östra Finlands universitet antecknar.
Enligt professor Laitinen, bots är relativt ofarliga, medan troll gör skada när de sprider falska nyheter och kommer med påhittade berättelser. Det är därför det finns ett behov av alltmer avancerade verktyg för övervakning av sociala medier.
"Detta är en komplex fråga och kräver tvärvetenskapliga tillvägagångssätt. Till exempel, vi lingvister arbetar tillsammans med maskininlärningsspecialister. Denna typ av arbete kräver också beslutsamhet och investeringar i forskningsinfrastrukturer som fungerar som en plattform för forskare från olika områden att samarbeta om. "
Enligt professor Laitinen, det är viktigt för forskare att ha tillgång till sociala medier.
"För närvarande, data tillhör amerikanska teknologikonglomerat, och en inkomstkälla. För att forskare ska få tillgång till dessa uppgifter, samarbete på nationell och internationell nivå, och särskilt EU:s engagemang behövs. "