• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Falsknyhetsdetektoralgoritm fungerar bättre än en människa

    Kredit:CC0 Public Domain

    Ett algoritmbaserat system som identifierar talande språkliga ledtrådar i falska nyheter kan ge nyhetsaggregatorer och webbplatser för sociala medier som Google News ett nytt vapen i kampen mot desinformation.

    Forskare från University of Michigan som utvecklade systemet har visat att det är jämförbart med och ibland bättre än människor på att korrekt identifiera falska nyheter.

    I en nyligen genomförd studie, det lyckades hitta förfalskningar upp till 76 procent av tiden, jämfört med en mänsklig framgång på 70 procent. Dessutom, deras språkliga analysmetod skulle kunna användas för att identifiera falska nyhetsartiklar som är för nya för att avslöjas genom att korsrefera deras fakta med andra berättelser.

    Rada Mihalcea, U-M datavetenskap och ingenjörsprofessor bakom projektet, sa att en automatiserad lösning kan vara ett viktigt verktyg för sajter som kämpar för att hantera en anstormning av falska nyheter, skapas ofta för att generera klick eller för att manipulera den allmänna opinionen.

    Att fånga falska historier innan de får verkliga konsekvenser kan vara svårt, eftersom aggregator och sociala medier idag är starkt beroende av mänskliga redaktörer som ofta inte kan hänga med i strömmen av nyheter. Dessutom, nuvarande debunking-tekniker beror ofta på extern verifiering av fakta, vilket kan vara svårt med de senaste berättelserna. Ofta, när en berättelse bevisas vara falsk, skadan är redan skedd.

    Språklig analys tar ett annat tillvägagångssätt, analysera kvantifierbara attribut som grammatisk struktur, ordval, interpunktion och komplexitet. Det fungerar snabbare än människor och det kan användas med en mängd olika nyhetstyper.

    "Du kan föreställa dig hur många ansökningar som helst för detta på fram- eller baksidan av en nyhets- eller sociala mediasajt, ", sade Mihalcea. "Det kan ge användare en uppskattning av tillförlitligheten av enskilda berättelser eller en hel nyhetssajt. Eller det kan vara en första försvarslinje på baksidan av en nyhetssajt, flagga misstänkta historier för vidare granskning. En framgångsfrekvens på 76 procent lämnar en ganska stor felmarginal, men det kan fortfarande ge värdefull insikt när det används tillsammans med människor."

    Språkliga algoritmer som analyserar skriftligt tal är ganska vanliga idag, sa Mihalcea. Utmaningen att bygga en falsknyhetsdetektor ligger inte i att bygga själva algoritmen, utan att hitta rätt data för att träna den algoritmen.

    Fake news dyker upp och försvinner snabbt, vilket gör det svårt att samla in. Det finns också i många genrer, ytterligare komplicera insamlingsprocessen. Satiriska nyheter, till exempel, är lätt att samla, men dess användning av ironi och absurditet gör det mindre användbart för att träna en algoritm för att upptäcka falska nyheter som är avsedda att vilseleda.

    I sista hand, Mihalceas team skapade sin egen data, crowdsourcing ett online-team som omvänd konstruerade verifierade äkta nyhetsartiklar till förfalskningar. Det är så de flesta fake news skapas, Mihalcea sa, av individer som snabbt skriver dem i utbyte mot en monetär belöning.

    Studiedeltagare, rekryterad med hjälp av Amazon Mechanical Turk, fick betalt för att bli kort, faktiska nyheter till liknande men falska nyheter, efterlikna artiklarnas journalistiska stil. I slutet av processen, forskargruppen hade en datauppsättning med 500 riktiga och falska nyheter.

    De matade sedan dessa märkta berättelsepar till en algoritm som utförde en språklig analys, lära sig skilja mellan riktiga och falska nyheter. Till sist, teamet vände algoritmerna till en datauppsättning av verkliga och falska nyheter hämtade direkt från webben, med 76 procents framgång.

    Detaljerna för det nya systemet och datauppsättningen som teamet använde för att bygga det är fritt tillgängliga, och Mihalcea säger att de kan användas av nyhetssajter eller andra enheter för att bygga sina egna system för upptäckt av falska nyheter. Hon säger att framtida system skulle kunna finslipas ytterligare genom att införliva metadata som länkar och kommentarer som är associerade med en given onlinenyhet.

    Ett dokument som beskriver systemet kommer att presenteras den 24 augusti vid den 27:e internationella konferensen om beräkningslingvistik i Santa Fe, N.M. Mihalcea arbetade med U-M datavetenskap och ingenjörsassistent forskare Veronica Perez-Rosas, psykologiforskaren Bennett Kleinberg vid universitetet i Amsterdam och U-M-studenten Alexandra Lefevre.

    Tidningen har titeln "Automatisk upptäckt av falska nyheter."


    © Vetenskap https://sv.scienceaq.com