• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Andra
    Orddetektiver:Vetenskap kan hjälpa till att fingra åsiktskrönikören

    Kredit:CC0 Public Domain

    Språkdetektiver säger att de viktigaste ledtrådarna till vem som skrev den anonyma New York Times åsiktsartikel där president Donald Trump smällde till president Donald Trump kanske inte är den udda och glittrande "lodestar, " men de bitiga orden som folk brukar läsa rakt över:"Jag, " "av" och "men."

    Och lodestar? Det kan vara en röd sill som är avsedd att kasta letare av spåret, säger vissa experter.

    Experter använder en kombination av språkanvändning, statistik och datavetenskap för att ta reda på vem som skrev dokument som är anonyma eller möjligen plagierade. De har till och med löst brott och historiska mysterier på det sättet. Vissa kallar fältet forensisk lingvistik, andra kallar det stylometri eller helt enkelt "författartillskrivning".

    Fältet är plötsligt i centrum efter att en oidentifierad "högre administrationstjänsteman" skrev i Times att han eller hon var en del av en "motståndsrörelse" som arbetade inifrån administrationen för att stävja Trumps farligaste impulser.

    "Min telefon har ringt av luren med förfrågningar om att göra den analysen och jag har helt enkelt inte tid, " säger dator- och språkforskaren Patrick Juola vid Duquesne University.

    Robert Leonard, en lingvistikprofessor vid Hofstra University som har hjälpt till att lösa mord genom att undersöka språket, säger att om experter kunde få rätt antal skrivprover från tjänstemän vars identitet är känd, "en analys skulle säkert kunna göras."

    En statsvetare menar att det finns ett 50-tal personer i Trump-administrationen som passar in på Times beskrivning som en högre tjänsteman i administrationen och kan vara författaren. Nyckeln skulle vara att titta på hur de skriver, orden de använder, vilka ord de sätter bredvid varandra, stavning, skiljetecken och till och med tider, säger experter.

    "Språk är en uppsättning val. Vad ska man säga, hur man säger och när man säger det, "Säger Juola. "Och det finns många olika alternativ."

    En av Juolas och andra experters favorittekniker är att titta på det som kallas "funktionsord". Det här är ord människor använder hela tiden men som är svåra att definiera eftersom de mer ger funktion än mening. Några exempel är "på, "''med, "''den, "'a, "''över" och "och."

    "Vi använder dem alla men vi använder dem inte på samma sätt, " säger Juola. "Vi använder dem inte i samma frekvens." Detsamma gäller apostrof och andra skiljetecken.

    Till exempel, säger du "annorlunda än" eller "annorlunda än?" frågar datavetenskaps- och dataexperten Shlomo Argamon från Illinois Institute of Technology.

    Kvinnor tenderar att använda första- och andrapersonspronomen mer - "Jag, "''jag" och "du" - och mer presens, säger Argamon.

    Män använder "den, "''av, "''det här" och "det" oftare, han säger.

    "Du letar efter ledtrådar och du försöker bedöma användbarheten av dessa ledtrådar, " säger Argamon. Men han är mindre optimistisk om att Trumps åsiktsärende kommer att knäckas av olika anledningar, inklusive New York Times redigering för stil och möjliga försök att lura språkdetektiver med ord som någon annan gillar att använda som "lodestar". Till största del, han är pessimistisk för att göra en ordentlig jämförelse, prover från alla misstänkta måste samlas in och vara lika, som alla åsiktsspalter i motsats till romaner, tal eller tidningshistorier.

    Rachel Greenstadt vid Drexel University studerar när människor försöker kasta av sig utredare med ord som de normalt inte använder eller målmedvetna dåliga stavningar. Hon säger att hennes första instinkt är att ordet "lodestar" - en vicepresident Mike Pence har använt flera gånger - är "en röd sill". Det verkar för medvetet.

    "De flesta människor letar fortfarande efter bra bra funktioner som lodestar istället för att försöka få grepp om hela bilden, "säger Hofstras Leonard.

    Greenstadt säger att språkanalys "kan bidra till bilden" av vem som skrev Times opinionsartiklar, men hon tillägger "av sig själv, Jag skulle vara orolig för att använda den."

    Fortfarande, med rätt förutsättningar ord spelar roll.

    Juola vittnade i ett 15-tal rättegångar och hanterade ännu fler fall som aldrig kom till domstol. Hans största fall var 2013, när en brittisk tidning fick ett tips om att boken "The Cuckoo's Calling" av Robert Galbraith verkligen var skriven av Harry Potter-författaren J.K. Rowling. Om ungefär en timme, Juola matade två Rowling-böcker, "The Cuckoo's Calling" och sex andra romaner i hans dator, analyserade språkmönstren med fyra olika system och kom fram till att Rowling gjorde det.

    Ett par dagar senare, Rowling erkände.

    Det var långt ifrån första gången som språkbruket fingrade den verkliga boven. Unabomberns bror identifierade honom på grund av hans distinkta skrivstil. Fältpionjärer hjälpte till att hitta en kidnappare som använde den unika termen "djävulsremsa" för gräsytan mellan trottoaren och vägen. Frasen används bara i delar av Ohio.

    Även inom politiken, ord är poker berättar. 1996, romanen "Primary Colors" om en Clintonesque presidentkandidat fick Washington att surra för att försöka lista ut vem som var den anonyma författaren. En analys av en Vassarprofessor och annat arbete pekade på Newsweeks Joe Klein och han erkände det till slut.

    Men det litterära spårandet går tillbaka till republikens grundande. Historiker hade svårt att lista ut vilka specifika Federalist Papers som skrevs av Alexander Hamilton och vilka som var av James Madison. En statistisk analys från 1963 räknade ut det:En av de många ledtrådarna kom ner till användningen av orden "medan" och "medan." Madison använde "medan"; Hamilton föredrog "medan".

    Juola säger att experter på området i allmänhet kan skilja introverta från extroverta, män från kvinnor, utbildningsnivå, ålder, plats, nästan allt utom astrologiskt tecken.

    "Vetenskapen är mycket bra, "Sa Juola." Det är inte riktigt DNA. Det anses faktiskt av vissa forskare anses vara den näst mest korrekta formen av rättsmedicinsk identifiering vi har eftersom den är så bra."

    © 2018 The Associated Press. Alla rättigheter förbehållna.




    © Vetenskap https://sv.scienceaq.com