• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • CoronaChecks webbplats bekämpar spridning av desinformation

    Kredit:CC0 Public Domain

    Cornell-forskare har utvecklat ett automatiserat system som använder maskininlärning, dataanalys och mänsklig feedback för att automatiskt verifiera statistiska påståenden om det nya coronaviruset.

    "CoronaCheck, " baserat på pågående forskning från Immanuel Trummer, biträdande professor i datavetenskap, lanserades internationellt i mars och har redan använts mer än 9, 600 gånger. Databasen - nu tillgänglig på engelska, Franska och italienska – kontrollerar påståenden om spridning av covid-19 baserat på tillförlitliga källor som Världshälsoorganisationen och Centers for Disease Control and Prevention.

    "Det finns alldeles för mycket desinformation om coronaviruset på webben - det är ganska häpnadsväckande, faktiskt, ", sa Trummer. "En del av dessa desinformationspåståenden är ofarliga, men andra - saker som att "äta silver botar coronaviruset" - kan vara farliga. "

    CoronaCheck-systemet är ett samarbete mellan Trummers team, inklusive doktorander Georgios Karagiannis och Saehan Jo, och Paolo Papottis team på Eurecom, en ingenjörskola i Biot, Frankrike.

    På grund av den stora mängden dålig information på internet - och i vilken takt mer desinformation produceras och sprids - är det omöjligt för människor att lösa problemet genom att utföra manuella faktakontroller ensam. Även vanliga automatiserade metoder, som i allmänhet försöker kartlägga nya påståenden till befintliga faktakontroller, kan inte realistiskt genomföras i en skala som är tillräckligt stor för att hantera desinformationens omfattning, sa Trummer.

    "Vi har försökt automatisera hela processen, från rådata till texten som vi vill verifiera, sa Trummer.

    CoronaCheck anpassar "Scrutinizer, "ett system Trummer utvecklat med Eurecom för International Energy Agency i Paris, en icke-statlig organisation, att stödja mänskliga faktakontrollanter vid översättning av textsammanfattningar till ekvationer som datorn kan förstå och lösa. Att göra detta, Scrutinizer använder maskininlärning och bearbetning av naturligt språk - en gren av artificiell intelligens som syftar till att dechiffrera mänskligt språk - liksom stora datamängder som hjälper systemet att ta reda på hur man ska närma sig varje nytt påstående, och feedback från mänskliga användare.

    "Datorer har svårt att förstå naturligt språk, ", sa han. "Vi kan inte direkt be datorn att kontrollera om något påstående i en mening är korrekt eller inte. Så vi måste i huvudsak översätta påståendet från vårt språk till ett frågespråk som datorn förstår."

    Till exempel, om någon skriver in att antalet fall av coronavirus är högre i Frankrike än i Italien, systemet använder en slags elimineringsprocess för att begränsa de möjliga ekvationerna för att representera den texten. Den bygger på sina datauppsättningar för att skapa ett matematiskt uttryck som kan jämföra påståendet med fakta.

    Sedan, baserat på erfarenhet, systemet bestämmer de bästa källorna för att verifiera påståendet, som bygger på tillförlitliga offentliga data som sammanställts dagligen av Johns Hopkins University. Systemets maskininlärningsmodell kan också förbättras med tiden, lära sig känna igen nya anspråkstyper baserat på användarfeedback.

    "Det finns en enorm mängd desinformation där ute och mängden påståenden som folk letar efter är ganska olika, ", sa Trummer. "För varje givet påstående, det finns ett mycket stort antal möjliga frågeuttryck, och vårt mål är att hitta den rätta."

    Databasgränssnittet bygger på Trummers relaterade arbete, inklusive AggChecker, det första verktyget för att automatiskt verifiera textsammanfattningar av datamängder genom att fråga en relationsdatabas. AggChecker presenterades på Association for Computing Machinerys Special Interest Group on Management of Datas årliga konferens 2019.

    Hans team har också utvecklat en "Anti-Knowledge Base" av vanliga faktafel från Wikipedia i samarbete med Google NYC. Forskningen bakom CoronaCheck finansierades delvis av ett Google Faculty Research Award.


    © Vetenskap https://sv.scienceaq.com