2018 års Dawn or Doom-konferens innehåller föredrag av mer än tre dussin Purdue-fakultetsmedlemmar och nationella experter som representerar fyra områden — Maskiner:artificiell intelligens, robotik, autonoma fordon och drönare; Sinne:effekter på internet och sociala medier; Kropp:bioteknik och mänsklig design; och Data:Internet of Things, integritet och cybersäkerhet. Kredit:Purdue University
"Jag mår illa." "Det här tv-spelet är SJUKT!" Till en dator, ordet "sjuk" kan ha samma betydelse i dessa två meningar.
Men en Purdue-professor kombinerar maskininlärning med modeller för sociala relationer och beteende för att läsa mellan textraderna och fånga författarens avsikt på ett djupare sätt. Tekniken kan hjälpa till att identifiera fördomar i sociala medier och nyhetsartiklar, desto bättre att bedöma informationens giltighet.
Traditionell bearbetning av naturligt språk innebär att man letar efter nyckelord – till exempel, Ordet "bra" skulle normalt indikera en positiv åsikt. Detta fungerar bra för vissa applikationer, men är inte till hjälp när texten är tvetydig, till exempel om författaren avsåg att ett ord eller en fras skulle vara sarkastisk eller tungan i ansiktet.
Det är där Purdue-professorn Dan Goldwassers synsätt kommer in. Han fokuserar särskilt på aktuella händelser och politiska frågor, och analyserar nyhetsartiklar och politikers tweets för att försöka avgöra hur författaren ramar in vissa frågor och vad deras ideologi är.
Goldwasser, en biträdande professor i datavetenskap, kommer att prata om detta arbete på Dawn or Doom '18, Purdues årliga konferens om riskerna och fördelarna med framväxande teknologier. Dawn or Doom kommer att hållas på Purdues West Lafayette campus måndag och tisdag (5-6 november). Konferensen, nu på sitt femte år, är gratis och öppet för allmänheten.
Dawn or Doom är i linje med Purdues Giant Leaps Sesquicentennial Campaign och är en del av Ideas Festival-temat, Jättesprång inom artificiell intelligens, Algoritmer, och Automation:Balansering mellan mänsklighet och teknik. Idéfestivalen är mittpunkten i kampanjen och kopplar samman världsberömda talare och Purdues expertis i ett samtal om de mest kritiska problemen och möjligheter som världen står inför.
I ett projekt, Goldwasser analyserar Twitter-inlägg från politiska tjänstemän. Tweets kan vara en utmanande form av text att tolka, eftersom de är korta och kan vara tvetydiga. Som ett exempel, efter en masskjutning, frasen "tankar och böner" kan användas uppriktigt för att uttrycka sympati för offrens familjer, men det kan också användas sarkastiskt som en kritik av bristen på statliga åtgärder mot vapenkontroll.
Goldwasser och hans team försöker förstå hur politiker utformar frågor eller händelser, och hur det ramverket belyser deras inställning i frågan. Att göra detta, han kombinerar språklig analys med modellering av sociala relationer och beteende. Sociala nätverk kan ge insikt i textens betydelse, för om två personer är nära förbundna, de kommer sannolikt att dela liknande ideologier. Beteende, till exempel när en individ gör inlägg på sociala medier, kan förutsäga vilka frågor de bryr sig om. Att kombinera alla tre modellerna ger en mer komplett bild av författarens avsikt än att förlita sig på någon av dem ensam.
I ett annat projekt, finansierat av Google, Goldwasser använder sociala relationsmodeller för att försöka identifiera fördomar i nyhetskällor. Nyckelord kan vara ett bra sätt att differentiera ideologi för en liten uppsättning data. Till exempel, en artikel om en masskjutning som fokuserar på skyttens mentala hälsa är mer sannolikt att ha en konservativ synvinkel, medan en artikel som diskuterar hur pistolen erhölls är mer sannolikt att ha en liberal syn.
"Problemet är att manuellt identifiera relevanta indikatorer för varje händelse är svårt att skala upp, säger Goldwasser.
Istället, hans team samlar in flera nyhetsartiklar om samma händelse och bygger ett nätverk av människor som delar artiklarna på sociala medier. Baserat på nätverkets koppling till individer eller organisationer med känd politisk inriktning, artikelns perspektiv kan härledas utan att man manuellt behöver generera relevanta sökord.