Upphovsman:University of California - Riverside
I februari, Justitiedepartementet anklagade 13 ryssar för att ha stulit amerikanska medborgares identiteter och spridning av "falska nyheter" med avsikt att undergräva det senaste amerikanska presidentvalet. Fallet pågår fortfarande, och kan göra det i flera år. Sålänge, UCR-forskare har byggt en teknikbaserad lösning för spridning av skadlig desinformation.
UCR:s Multi-Aspect Data Lab, ledd av Evangelos E. Papalexakis, biträdande professor vid avdelningen för datavetenskap och teknik, utvecklar nya datavetenskapliga tekniker för att ta itu med en mängd olika problem i sociala nätverksanalyser, med finansiering från Naval Sea Systems Command, Naval Engineering Education Consortium, National Science Foundation, och Adobe.
Forskarna bygger algoritmer för att urskilja mönster som indikerar "falska nyheter". Genom extrapolering, och kommandon infogade i utgivares innehållshanteringssystem, dessa föremål kan sedan tas bort innan de går live och orsakar förödelse. Avgörande, UCR -beräkningen kan registrera "fotavtryck" för sådana inlägg för att stödja åtal.
Papalexakis senaste akademiska artikel om detta arbete:"Oövervakad innehållsbaserad identifiering av falska nyhetsartiklar med Tensor Decomposition Ensembles, "samskriven med doktorandforskaren Seyed Mehdi Hosseini Motlagh, presenterades, och vann "bästa papperspriset, " på den senaste MIS2:Misinformation and Misbehavior Mining on the Web workshop, del av WSDM 2018 (11:e ACM International Conference on Web Search and Data Mining).
"Tidigare studier har gett användbara insikter om spridning av en artikel i ett socialt nätverk. Men upptäckt baserad enbart på detta innebär risken att en falsk nyhetsartikel "infekterar" ett antal användare av sociala medier innan den upptäcks, " sa Papalexakis. "Istället, vårt arbete syftar till att tidigt upptäcka sådana artiklar, särskilt i fall där vi inte har någon extern kunskap om giltigheten och sanningshalten hos någon artikel."
Mänsklig nätverksövervakning bygger på en kombination av sunt förnuft och erfarenhet för att veta om något är legitimt. Till exempel, moderatorer kontrollerar om rubriken finns i ALLA CAPS (digi-kulturkod för "skrik"), använd välkända sökord på hatbrottsspråk, och leta efter en brist på verifierade källor för falska påståenden.
Men hur lär du en dator att dessa triangulerade attribut ofta indikerar "falska nyheter"?
Maskinbaserad förståelse bygger enbart på matematiska begrepp, så Papalexakis och hans forskare använder vad som kallas "Multi-Aspect Data." Enkelt uttryckt, bild en social gruppering där alla i interaktionen har många sätt att ansluta (dvs. telefon, text, video, snabbmeddelande, inlägg på sociala medier). Multi-Aspect Data Lab registrerar sedan, undersöker, kategoriserar och modellerar alla dessa ingångar, baserat på vad som kallas "tensornedbrytningar". En "tensor" i datavetenskap betyder en flerdimensionell struktur, som en kub. Alla multiaspekter fångas digitalt som flerdimensionella kuber så att systemet kan undersöka och "förstå" vad som verkligen händer – och om nyheterna är falska, eller inte.
"De tensors sönderdelningstekniker vi utvecklar kan fånga nyanserade mönster som framgångsrikt identifierar olika kategorier av falska nyheter, utan att använda någon extern kunskap om giltigheten av någon särskild artikel." sa Papalexakis.
Genom att utnyttja mångfalden av alla dataaspekter, UCR -systemet ger ett mer exakt resultat än tidigare publicerad forskning inom detta område. I deras tidning, författarna illustrerar hur de sammanställer sin algoritm, publicera sedan resultaten från flera experiment, som visar att den föreslagna algoritmen identifierade upp till 80 procent av falska nyheter.
Industrin har tagit del av detta. Papalexakis sa att han aktivt driver samarbeten med stora teknikjättar.