• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Städa upp sociala medier med maskininlärning

    Kredit:CC0 Public Domain

    Vuxen, eller pornografisk, innehållsspam är ett växande problem på sociala medier. Ny forskning i International Journal of Business Intelligence and Data Mining diskuterar hur sådant innehåll snabbt kan upptäckas och tas bort i tid.

    Deepali Dhaka, Surbhi Kakar och Monica Mehrotra från Jamia Millia Islamia (Central University) i Jamia Nagar, New Delhi, Indien, förklarar hur den allmänna användarupplevelsen och den för yngre personer som använder sociala medier kan förbättras om obscent spam-innehåll kan filtreras effektivt och snabbt. Maskininlärningsverktyg är ofta vägen framåt för att upptäcka särskilda typer av innehåll och teamet har visat att ett sådant verktyg, XGboost, kan upptäcka vuxet spaminnehåll med mer än 90 % noggrannhet. Detta var den mest effektiva klassificeringsalgoritmen av de sex som testades och anpassades av teamet för att upptäcka pornografisk spam på Twitter.

    Som sådan skulle färre än tio av hundra uppdateringar som flaggats som skräppost för vuxna vara falska positiva. Teamets tillvägagångssätt behövde bara analysera ett litet antal funktioner, värdesystem, ordens entropi, lexikal mångfald och ordinbäddningar, för att kunna plocka uppdateringar av vuxen skräppost från den allmänna strömmen av uppdateringar på en av de mest välkända sociala medieplattformar, Twitter.

    Inneboende i positiv upptäckt är att vardagliga användare av plattformen generellt diskuterar en mängd olika ämnen i olika sammanhang och skriver och delar på vad som kan kallas ett organiskt sätt. Däremot tenderar spammare och pornografiska spammare, i det här fallet, att ha en fast eller till och med helt automatiserad inställning till sina uppdateringar, begränsad mångfald av ämne, som man kan förvänta sig, och ett mycket begränsat lexikon. Dessa och andra egenskaper hos skräppostmeddelanden gör dem igenkännbara för algoritmen. + Utforska vidare

    Twitter säger att det tar bort 1 miljon skräppostkonton om dagen




    © Vetenskap https://sv.scienceaq.com