• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Utvärdering av toxiciteten hos Reddit-kommentarer

    Kredit:CC0 Public Domain

    Ny forskning, publicerad i PeerJ Computer Science , som analyserar över 87 miljoner inlägg och 2,205 miljarder kommentarer på Reddit från mer än 1,2 miljoner unika användare, undersöker förändringar i onlinebeteendet för användare som publicerar i flera gemenskaper på Reddit genom att mäta "toxicitet".

    Analys av användarbeteendetoxicitet visade att 16,11 % av användarna publicerar giftiga inlägg och 13,28 % av användarna publicerar giftiga kommentarer. 30,68 % av användarna som publicerar inlägg och 81,67 % av användarna som publicerar kommentarer uppvisar förändringar i sin toxicitet i olika samhällen – eller subreddits – vilket indikerar att användare anpassar sitt beteende till gemenskapernas normer.

    Studien tyder på att ett sätt att begränsa spridningen av toxicitet är att begränsa de samhällen där användare kan delta. Forskarna fann ett positivt samband mellan ökningen av antalet samhällen och ökningen av toxicitet men kan inte garantera att detta är den enda orsaken bakom ökningen av gifthalten.

    Olika typer av innehåll kan delas och publiceras på sociala medieplattformar, vilket gör det möjligt för användare att kommunicera med varandra på olika sätt. Tillväxten av sociala medieplattformar har tyvärr lett till en explosion av skadligt innehåll som trakasserier, svordomar och nätmobbning. Olika skäl kan motivera användare av sociala medieplattformar att sprida skadligt innehåll. Det har visat sig att publicering av giftigt innehåll (d.v.s. skadligt beteende) sprider sig – det skadliga beteendet hos icke-illvilliga användare kan påverka icke-illvilliga användare och få dem att missköta sig, vilket negativt påverkar onlinegemenskaper.

    "En utmaning med att studera onlinetoxicitet är den mångfald av former det tar, inklusive hatretorik, trakasserier och nätmobbning. Giftigt innehåll innehåller ofta förolämpningar, hot och stötande språk, som i sin tur kontaminerar onlineplattformar. Flera onlineplattformar har implementerats. förebyggande mekanismer, men dessa ansträngningar är inte tillräckligt skalbara för att begränsa den snabba tillväxten av giftigt innehåll på onlineplattformar. Dessa utmaningar kräver att man utvecklar effektiva automatiska eller halvautomatiska lösningar för att upptäcka toxicitet från en stor ström av innehåll på onlineplattformar", säger författarna, Ph.D. (ABD) Hind Almerekhi, Dr Haewoon Kwak och professor Bernard J. Jansen.

    "Att övervaka förändringen i användarnas toxicitet kan vara en tidig upptäcktsmetod för toxicitet i onlinegemenskaper. Den föreslagna metoden kan identifiera när användare uppvisar en förändring genom att beräkna toxicitetsprocenten i inlägg och kommentarer. Denna förändring, i kombination med toxicitetsnivån vårt system upptäcker i användarnas inlägg, kan användas effektivt för att stoppa spridning av toxicitet."

    Forskargruppen, med hjälp av crowdsourcing, byggde en märkt dataset med 10 083 Reddit-kommentarer och använde sedan datamängden för att träna och finjustera en Bidirectional Encoder Representations from Transformers (BERT) neurala nätverksmodell. Modellen förutspådde toxicitetsnivåerna för 87 376 912 inlägg från 577 835 användare och 2 205 581 786 kommentarer från 890 913 användare på Reddit under 16 år, från 2005 till 2020.

    Denna studie använde toxicitetsnivåerna för användarinnehåll för att identifiera toxicitetsförändringar av användaren inom samma gemenskap, över flera gemenskaper och över tid. För prestanda för toxicitetsdetektering uppnådde den finjusterade BERT-modellen en klassificeringsnoggrannhet på 91,27 % och en AUC-poäng (Area Under the Receiver Operating Characteristic Curve) på 0,963 och överträffade flera baslinjemodeller för maskininlärning och neurala nätverk. + Utforska vidare

    Studien visar att toxicitet i öppen källkodsgemenskapen skiljer sig från andra internetforum




    © Vetenskap https://sv.scienceaq.com