William Sethares. Kredit:University of Wisconsin-Madison
Forskare vid University of Wisconsin–Madison använder datorer på nya sätt för att utveckla en heltäckande bild av hur människor kommunicerar om politik, och hur dessa konversationer kan formas av media, sociala nätverk och personliga interaktioner.
Vad deras datoranalys finner, forskarna hoppas, skulle kunna hjälpa till att överbrygga klyftan mellan människor på båda sidor av den politiska gången som inte kan gå samman för att lösa samhällets problem eftersom de inte ens kan prata med varandra – så mycket att de lika gärna kan prata olika språk.
"En av de viktigaste frågorna för oss är:Hjälper kommunikationssystemet människor att förstå de problem de definierar i sina sociala och politiska liv?" säger Lewis Friedland, professor vid UW–Madisons School of Journalism and Mass Communication. "Eller, har vi ett system som faktiskt förvärrar splittringen mellan människor - som gör det lättare att dela upp i "ingrupper" och "utgrupper, "att se andra som olik oss eller ovärdiga?"
Rita på inlägg på sociala medier, opinionsundersökningar, nyhetsbevakning och personliga intervjuer från hela Wisconsin som sträcker sig tillbaka till 2010, Friedland och medarbetare kommer att måla upp en bild av politiska interaktioner som ett levande, föränderlig miljö — en "kommunikationsekologi" — med vävar av interaktion mellan människor och institutioner i staten. Stöds av finansiering från UW2020-initiativet, det är en av de mest ambitiösa ansträngningarna någonsin att förstå hur människor i en hel stat pratar om politik, och hur dessa konversationer har förändrats över tiden.
"Ingen har försökt modellera kommunikationsekologier på en statlig nivå, särskilt över åtta år, " säger Friedland. "Det krävs enorm kreativitet för att samla in data, modellera relationer och utveckla analysmetoder."
Forskarna utnyttjar kraften i maskininlärning, där UW–Madison är en ledande innovatör, för att upptäcka hur människor med motsatt politisk övertygelse tilldelar samma ord olika betydelser.
Till exempel, ordet "reglering" kan ha väsentligt olika konnotationer - "hjälpsam och nödvändig" eller "tungande och invasiv" - för liberaler och konservativa. Även om dessa känslor kan verka intuitiva, det är svårt att noggrant definiera och kvantifiera exakt hur människor tilldelar ord betydelser.
Maskininlärning erbjuder en lösning på det problemet genom att omvandla ord till geometriska begrepp som kallas vektorer och använda matematiska operationer för att göra jämförelser.
"Vektorer visar dig något om orden, säger William Sethares, en UW–Madison professor i el- och datateknik och samarbetspartner i projektet. "Enkla saker som synonymer kommer att ha liknande vektorer, och vektorer för analoga ord kommer att ha samma relationer till varandra."
Vektorer är abstrakta objekt som har längd och riktning; i två dimensioner, en vektor ser ut som en pilsymbol. Ordvektorer liknar enkla pilar, förutom att de finns i många fler dimensioner. Även om det skulle vara omöjligt att rita ordvektorer på ett platt pappersark, representationerna för "kung" och "drottning" skulle, på sätt och vis, pekar i samma riktningar med avseende på varandra som de för "pojke" och "tjej".
Efter att ha jämfört vektorer från ungefär 2, 000 tweets postade av liberaler, konservativa och partilösa, forskarna identifierade de 10 bästa orden med olika användningsområden mellan politiska ideologier, inklusive "politiker, " "regering" och "miljö."
Att avslöja dessa skillnader krävde en ny beräkningsmetod, utvecklad av Sethares och doktoranden Prathusha Sarma.
Processen att omvandla ord till vektorer kallas inbäddning, och det involverar vanligtvis programmeringsalgoritmer för att tråla igenom enorma mängder text, like the entirety of Wikipedia or every Google news story ever published.
The problem is that the powerful generic word embeddings from giant databases like Wikipedia often miss nuances in language—after all, every word becomes one single vector, so terms with multiple meanings can confuse even the smartest algorithms (think of "hack, " which can describe either what an ax does, a computer invasion, or an untalented writer).
While those subtle differences might emerge in specific data sets, like the text of 2, 000 political tweets, there simply wouldn't be enough words to construct accurate vectors.
"Any small niche uses words in its own way, " says Sethares. "The things that work really well require billions of words, so we're caught in a trap because we can't train algorithms on a small data set."
Istället, Sethares and Sarma found an effective method to combine the strength of word embeddings derived from Wikipedia with the specificity of political tweets. Their algorithm not only identified words that conservatives and liberals use differently, but also predicted the political ideology of a tweet's author with roughly 90 percent accuracy based on language alone.
Sethares and colleagues plan to apply the same machine learning approaches to Wisconsin political news and campaign speeches. The approach could enable them to draw comparisons between political dialogue in urban and rural communities as well as examine how partisan word meanings may have shifted over time.
They then will combine information about word meanings with additional layers of data, including insights from in-person interviews, election results and historical statistics from public opinion polling. The resulting communication ecology will offer unprecedented insights into how the Wisconsin political environment is evolving.
"The environment is getting noisier and noisier, " says Friedland. "People who have limited time and attention can only focus on so much in a given day."
And even though untangling partisan gridlock will require substantial empathy and effort from people across the political spectrum, understanding the communication environment is an important first step toward bridging the divide, Friedland adds.