Kredit:Köpenhamns universitet
Män beskrivs vanligtvis med ord som hänvisar till beteende, medan adjektiv som tillskrivs kvinnor tenderar att vara associerade med fysiskt utseende. Detta, enligt en grupp datavetenskapare från Köpenhamns universitet och andra universitet som använde maskininlärning för att analysera 3,5 miljoner böcker.
"Vackra" och "sexiga" är två av de adjektiv som oftast används för att beskriva kvinnor. Vanliga beskrivningar för män inkluderar "rättfärdiga, "" rationell "och" modig ".
En datavetare från Köpenhamns universitet, tillsammans med andra forskare från USA, trålade genom en enorm mängd böcker i ett försök att ta reda på om det finns en skillnad mellan de typer av ord som används för att beskriva män och kvinnor i litteraturen. Med en ny datormodell, forskarna analyserade en dataset med 3,5 miljoner böcker, alla publicerade på engelska mellan 1900 och 2008. Böckerna innehåller en blandning av skönlitteratur och facklitteratur.
"Vi kan tydligt se att de ord som används för kvinnor hänvisar mycket mer till deras utseende än de ord som används för att beskriva män. Således, vi har kunnat bekräfta en utbredd uppfattning, bara nu på statistisk nivå, "säger datavetare och biträdande professor Isabelle Augenstein vid Köpenhamns universitet vid institutionen för datavetenskap.
Forskarna extraherade adjektiv och verb associerade med könsspecifika substantiv (t.ex. 'dotter' och 'stewardess'). Till exempel, i kombinationer som 'sexig stewardess' eller 'flickor som skvallrar'. De analyserade sedan om orden hade en positiv, negativ eller neutral känsla, och därefter vilka kategorier orden kunde delas in i.
Deras analyser visar att negativa verb i samband med kropp och utseende används med fem gånger frekvensen för kvinnor än män. Analyserna visar också att positiva och neutrala adjektiv som rör kropp och utseende förekommer ungefär dubbelt så ofta i beskrivningar av kvinnor, medan män oftast beskrivs med hjälp av adjektiv som hänvisar till deras beteende och personliga egenskaper.
Förr, lingvister tittade vanligtvis på förekomsten av könsspråk och partiskhet, men använder mindre datamängder. Nu, datavetare kan använda algoritmer för maskininlärning för att analysera stora datamängder - i det här fallet 11 miljarder ord.
Nytt liv för gamla könsstereotyper
Även om många av böckerna gavs ut för flera decennier sedan, de spelar fortfarande en aktiv roll, påpekar Isabelle Augenstein. Algoritmerna som används för att skapa maskiner och applikationer som kan förstå mänskligt språk matas med data i form av textmaterial som är tillgängligt online. Detta är tekniken som gör att smartphones kan känna igen våra röster och gör det möjligt för Google att ge förslag på sökord.
"Algoritmerna fungerar för att identifiera mönster, och när som helst man observerar, det uppfattas att något är 'sant.' Om något av dessa mönster hänvisar till partiskt språk, resultatet kommer också att vara partiskt. Systemen antar, så att säga, språket som vi människor använder, och sålunda, våra könsstereotyper och fördomar, "säger Isabelle Augenstein, och ger ett exempel på var det kan vara viktigt:
"Om det språk vi använder för att beskriva män och kvinnor skiljer sig åt, i anställdas rekommendationer till exempel, Det kommer att påverka vem som erbjuds ett jobb när företag använder IT -system för att sortera jobbansökningar. "
När artificiell intelligens och språkteknologi blir mer framträdande i samhället, Det är viktigt att vara medveten om könsspråk.
Augenstein fortsätter:"Vi kan försöka ta hänsyn till detta när vi utvecklar maskininlärningsmodeller genom att antingen använda mindre partisk text eller genom att tvinga modeller att ignorera eller motverka fördomar. Alla tre sakerna är möjliga."
Forskarna påpekar att analysen har sina begränsningar, genom att det inte tar hänsyn till vem som skrev de enskilda passagen och skillnaderna i förspänningsgraderna beroende på om böckerna publicerades under en tidigare eller senare period inom datauppsättningens tidslinje. Vidare, det skiljer inte mellan genrer - t.ex. mellan romantiska romaner och facklitteratur. Forskarna följer för närvarande upp flera av dessa föremål.