Kredit:CC0 Public Domain
Artificiell intelligens-system och maskininlärningsalgoritmer har hamnat under eld nyligen eftersom de kan ta upp och förstärka befintliga fördomar i vårt samhälle, beroende på vilken data de är programmerade med.
Men en tvärvetenskaplig grupp Stanford-forskare vände detta problem på huvudet på ett nytt Proceedings of the National Academy of Sciences tidning publicerad 3 april.
Forskarna använde ordinbäddningar – en algoritmisk teknik som kan kartlägga relationer och samband mellan ord – för att mäta förändringar i kön och etniska stereotyper under det senaste århundradet i USA. De analyserade stora databaser med amerikanska böcker, tidningar och andra texter och tittade på hur dessa språkliga förändringar korrelerade med faktiska demografiska uppgifter från USA:s folkräkning och stora sociala förändringar som kvinnorörelsen på 1960-talet och ökningen av asiatisk immigration, enligt forskningen.
"Ordinbäddningar kan användas som ett mikroskop för att studera historiska förändringar i stereotyper i vårt samhälle, " sa James Zou, en biträdande professor i biomedicinsk datavetenskap. "Vår tidigare forskning har visat att inbäddningar effektivt fångar befintliga stereotyper och att dessa fördomar systematiskt kan tas bort. Men vi tror att, istället för att ta bort dessa stereotyper, vi kan också använda inbäddningar som en historisk lins för kvantitativa, språkliga och sociologiska analyser av fördomar."
Zou skrev artikeln tillsammans med historieprofessor Londa Schiebinger, lingvistik och datavetenskap professor Dan Jurafsky och elteknikstudent Nikhil Garg, som var huvudförfattare.
"Den här typen av forskning öppnar alla typer av dörrar för oss, ", sade Schiebinger. "Det ger en ny nivå av bevis som tillåter humaniora forskare att gå efter frågor om utvecklingen av stereotyper och fördomar i en skala som aldrig har gjorts tidigare."
Ordens geometri
En ordinbäddning är en algoritm som används, eller utbildad, på en textsamling. Algoritmen tilldelar sedan en geometrisk vektor till varje ord, representerar varje ord som en punkt i rymden. Tekniken använder plats i detta utrymme för att fånga associationer mellan ord i källtexten.
"Inbäddningar är ett kraftfullt språkligt verktyg för att mäta subtila aspekter av ordets betydelse, såsom partiskhet, " sa Jurafsky.
Ta ordet "hederlig". Med hjälp av inbäddningsverktyget, tidigare forskning fann att adjektivet har en närmare relation till ordet "man" än ordet "kvinna".
I sin nya forskning, Stanford-teamet använde inbäddningar för att identifiera specifika yrken och adjektiv som var partiska mot kvinnor och särskilda etniska grupper efter decennium från 1900 till idag. Forskarna tränade dessa inbäddningar i tidningsdatabaser och använde även inbäddningar som tidigare tränats av Stanfords datavetenskapsstudent Will Hamilton på andra stora textdatauppsättningar, som Google Books-korpusen av amerikanska böcker, som innehåller över 130 miljarder ord publicerade under 1900- och 2000-talen.
Forskarna jämförde de fördomar som hittats av dessa inbäddningar med demografiska förändringar i data från USA:s folkräkning mellan 1900 och nutid.
Förskjutningar i stereotyper
Forskningsresultaten visade kvantifierbara förändringar i könsskildringar och fördomar mot asiater och andra etniska grupper under 1900-talet.
En av de viktigaste resultaten som kom fram var hur fördomar mot kvinnor förändrades till det bättre – på vissa sätt – över tiden.
Till exempel, adjektiv som "intelligent, ""logiskt" och "tänksamt" förknippades mer med män under första hälften av 1900-talet. Men sedan 1960-talet, samma ord har alltmer förknippats med kvinnor med varje följande decennium, korrelerar med kvinnorörelsen på 1960-talet, även om det fortfarande finns en lucka.
Forskningen visade också en dramatisk förändring i stereotyper mot asiater och asiatiska amerikaner.
Till exempel, på 1910-talet, ord som "barbarisk, " "monstruös" och "grym" var de adjektiv som mest förknippades med asiatiska efternamn. På 1990-talet, dessa adjektiv ersattes med ord som "hämmad, " "passiv" och "känslig." Denna språkliga förändring korrelerar med en kraftig ökning av asiatisk immigration till USA på 1960- och 1980-talen och en förändring i kulturella stereotyper, sa forskarna.
"Det skarpa i förändringen i stereotyper stod ut för mig, " sa Garg. "När du studerar historia, du lär dig om propagandakampanjer och dessa förlegade syn på utländska grupper. Men hur mycket litteraturen som producerades vid den tiden återspeglade dessa stereotyper var svårt att uppskatta."
Övergripande, forskarna visade att förändringar i ordet inbäddningar följs nära med demografiska förändringar mätt av U.S. Census.
Fruktbart samarbete
Den nya forskningen belyser värdet av tvärvetenskapligt lagarbete mellan humaniora och vetenskap, sa forskare.
Schiebinger sa att hon nådde ut till Zou, som kom till Stanford 2016, efter att hon läst hans tidigare arbete om de-biasing machine-learning algoritmer.
"Detta ledde till ett mycket intressant och fruktbart samarbete, Schiebinger sa, och tillägger att medlemmarna i gruppen arbetar på ytterligare forskning tillsammans.
"Det understryker vikten av att humanister och datavetare arbetar tillsammans. Det finns en kraft i dessa nya maskininlärningsmetoder inom humanistisk forskning som bara håller på att förstås, " Hon sa.