Städa upp sociala medier med maskininlärning

Kredit:CC0 Public Domain

Vuxen, eller pornografisk, innehållsspam är ett växande problem på sociala medier. Ny forskning i International Journal of Business Intelligence and Data Mining diskuterar hur sådant innehåll snabbt kan upptäckas och tas bort i tid.

Deepali Dhaka, Surbhi Kakar och Monica Mehrotra från Jamia Millia Islamia (Central University) i Jamia Nagar, New Delhi, Indien, förklarar hur den allmänna användarupplevelsen och den för yngre personer som använder sociala medier kan förbättras om obscent spam-innehåll kan filtreras effektivt och snabbt. Maskininlärningsverktyg är ofta vägen framåt för att upptäcka särskilda typer av innehåll och teamet har visat att ett sådant verktyg, XGboost, kan upptäcka vuxet spaminnehåll med mer än 90 % noggrannhet. Detta var den mest effektiva klassificeringsalgoritmen av de sex som testades och anpassades av teamet för att upptäcka pornografisk spam på Twitter.

Som sådan skulle färre än tio av hundra uppdateringar som flaggats som skräppost för vuxna vara falska positiva. Teamets tillvägagångssätt behövde bara analysera ett litet antal funktioner, värdesystem, ordens entropi, lexikal mångfald och ordinbäddningar, för att kunna plocka uppdateringar av vuxen skräppost från den allmänna strömmen av uppdateringar på en av de mest välkända sociala medieplattformar, Twitter.

Inneboende i positiv upptäckt är att vardagliga användare av plattformen generellt diskuterar en mängd olika ämnen i olika sammanhang och skriver och delar på vad som kan kallas ett organiskt sätt. Däremot tenderar spammare och pornografiska spammare, i det här fallet, att ha en fast eller till och med helt automatiserad inställning till sina uppdateringar, begränsad mångfald av ämne, som man kan förvänta sig, och ett mycket begränsat lexikon. Dessa och andra egenskaper hos skräppostmeddelanden gör dem igenkännbara för algoritmen. + Utforska vidare

Twitter säger att det tar bort 1 miljon skräppostkonton om dagen

Nästa generations hörapparater kunde läsa läppar genom masker

Varför digitala transformationsprojekt misslyckas och hur dataarkitektur kan hjälpa

Elektronik

Teknikföretag kämpar för att ta bort inspelningsvideo från Nya Zeeland

Ska polisen använda datorer för att förutse brott och brottslingar?

System för att lokalisera räddningsstyrkor i nöd

Vetenskap

Forskare utvecklar mikroskopisk teori om polymergel

Våren smälter en stig genom den frusna finska skärgården

SpaceX startas igen på måndag