April Fools bluffhistorier kan ge ledtrådar för att identifiera falska nyheter

Kredit:CC0 Public Domain

Att studera aprilskämt-nyheter kan ge ledtrådar till att upptäcka "falska nyheter"-artiklar, visar ny forskning.

Akademiska experter inom Natural Language Processing från Lancaster University som är intresserade av bedrägeri har jämfört språket som används i skrivna aprilskämt och falska nyheter.

De har upptäckt att det finns likheter i den skrivna strukturen för humoristiska aprilskämt-bluffar – parodiartiklar som publiceras av media varje 1 april – och skadliga falska nyheter.

Forskarna har sammanställt en ny datamängd, eller korpus, av mer än 500 aprilskämtartiklar hämtade från mer än 370 webbplatser och skrivna under 14 år.

"Aprilfools är mycket användbara eftersom de ger oss en verifierbar mängd bedrägliga texter som ger oss en möjlighet att ta reda på de språkliga tekniker som används när en författare skriver något fiktivt förklädd som en faktaberättelse, " sa Edward Dearden från Lancaster University, och huvudförfattare till forskningen. "Genom att titta på språket som används i aprilskämt och jämföra dem med falska nyheter kan vi få en bättre bild av vilka typer av språk som används av författare till desinformation."

En jämförelse av aprilskämt-blufftexter mot äkta nyhetsartiklar skrivna under samma period – men inte publicerade den 1 april – avslöjade stilistiska skillnader.

Forskare fokuserade på specifika egenskaper i texterna, som mängden detaljer som används, vaghet, skrivstilens formalitet och språkets komplexitet.

De jämförde sedan aprilskämthistorierna med en datauppsättning av "falska nyheter", tidigare sammanställt av ett annat team av forskare.

Även om inte alla funktioner som hittades i aprilskämt visade sig vara användbara för att upptäcka falska nyheter, det fanns ett antal liknande egenskaper i båda.

De fann aprilskämt och falska nyhetsartiklar tenderar att innehålla ett mindre komplext språk, lättare lässvårigheter, och längre meningar än äkta nyheter.

Viktig information för nyheter, som namn, platser, datum och tider, visade sig användas mer sällan inom april-bluffar och falska nyheter. Dock, egennamn, som namnen på framstående politiker "Trump" eller "Hillary", finns mer rikligt med falska nyheter än i äkta nyhetsartiklar eller aprilskämt, som har betydligt färre.

Första persons pronomen, som "vi", är också ett framträdande inslag för både aprilskämt och falska nyheter. Detta går emot traditionellt tänkande inom bedrägeriupptäckt, vilket tyder på att lögnare använder färre förstapersonspronomen.

Forskarna fann att aprillurar bluffhistorier, jämfört med äkta nyheter:

Är i allmänhet kortare i längd
Använd mer unika ord
Använd längre meningar
Är lättare att läsa
Hänvisa till vaga händelser i framtiden
Innehåller fler referenser till nuet
Är mindre intresserad av tidigare händelser
Innehåller färre egennamn
Använd fler förstapersonspronomen

Falska nyheter, jämfört med äkta nyheter:

Är kortare i längd
Är lättare att läsa
Använd ett förenklat språk
Innehåller färre skiljetecken
Innehåller fler egennamn
Är i allmänhet mindre formella – använd fler förnamn som "Hillary" och innehåller mer svordomar och stavfel
Innehåller väldigt få datum
Använd fler förstapersonspronomen

Forskarna skapade också en "klassificerare" för maskininlärning för att identifiera om artiklarna är aprilskämt, falska nyheter eller genuina nyheter. Klassificeraren uppnådde 75 procents noggrannhet vid identifiering av aprilskämtartiklar och 72 procent för att identifiera falska nyheter. När klassificeraren utbildades i aprilskämt och satte i uppgift att identifiera falska nyheter noterade den en noggrannhet på mer än 65 procent.

Dr Alistair Baron, medförfattare till tidningen, sa:"Att titta på detaljer och komplexitet i en text är avgörande när man försöker avgöra om en artikel är en bluff. Även om det finns många skillnader, våra resultat tyder på att aprilskämt och falska nyhetsartiklar delar några liknande egenskaper, mestadels involverar strukturell komplexitet.

"Våra resultat tyder på att det finns vissa gemensamma drag mellan olika former av desinformation och att utforska dessa likheter kan ge viktiga insikter för framtida forskning om bedrägliga nyheter."

Forskningen har beskrivits i tidningen "Fool's Errand:Looking at April Fools Hoaxes as Disinformation through the Lens of Deception and Humor", som kommer att presenteras vid den 20:e internationella konferensen om beräkningslingvistik och intelligent textbehandling, kommer att hållas i La Rochelle i april.

Ny art av mastodont upptäcktes i Kalifornien

Katastrofala misslyckanden i jordens globala system ledde till utrotningen av dinosaurierna - vi kan fortfarande gå samma väg

Andra