Antalet medlemmar som valts till NAS fördelat på år och (A) kön eller (B) prestige för medlemmens institutionella tillhörighet. Endast medlemmar som är aktiva inom sju områden från och med 2021 beaktas. Kredit:Proceedings of the National Academy of Sciences (2022). DOI:10.1073/pnas.2206070119
Det är 2022 och kvinnor inom vetenskapen är fortfarande mindre benägna att bli anställda och befordrade än sina manliga kamrater. Kvinnor är mindre benägna att bli mentorda av framstående fakulteter, de publicerar i mindre prestigefyllda tidskrifter, har färre medarbetare, är underrepresenterade bland tidskriftsrecensenter och redaktörer och deras tidningar får färre citeringar. Hur händer detta?
USC:s Information Sciences Institute (ISI) huvudforskare Kristina Lerman och hennes team använde AI för att leta efter svar på denna fråga. Den resulterande artikeln har publicerats i den peer-reviewed, multidisciplinära vetenskapstidskriften Proceedings of the National Academy of Sciences (PNAS ) den 26 september 2022.
Som kvinna inom vetenskapen själv känner Lerman till världen hon arbetar i, men till och med hon blev chockad av statistik som hon nyligen fick veta:endast 2 % av nobelpristagarna i fysik har varit kvinnor (tills för några år sedan var det 1 %) och dessa siffror är likartade inom många vetenskapliga områden. Lerman sa, "bara 7 % av Nobelpristagarna i kemi har varit kvinnor! Kvinnor har arbetat med kemi under så lång tid, så hur är det? Vi var nyfikna på denna diskrepans."
Rätt data, rätt tid
Lerman hade rätt datauppsättning för problemet. Sedan 2019 hade hon och hennes team arbetat med ett stort projekt som använde AI för att förutsäga reproducerbarheten av forskningsartiklar. ISI-teamet använde AI för att analysera många aspekter av vetenskapliga artiklar, inklusive citat, för att förutsäga reproducerbarhet. De publicerade artikeln "Assessing Scientific Research Papers with Knowledge Graphs" på ACM SIGIR 22 (The Association for Computing Machinery's Special Interest Group on Information Retrieval) i juli 2022, där de beskrev deras nya metod och lovande resultat.
För att göra denna reproducerbarhetsforskning samlade Lermans team en enorm mängd data om akademiska artiklar. Hennes medförfattare Jay Pujara, chef för Center on Knowledge Graphs vid ISI sa:"Vi samlade in den här mycket stora citeringsgrafen - nätverket av tidningar, författare, citat, referenser, samarbeten, författarinstitutioner, där de publicerar, etc." De förvandlade denna data till en enorm kunskapsgraf (en "kunskapsgraf" är en representation av ett nätverk av verkliga enheter som illustrerar relationerna mellan dem).
Teamet tittade på formerna eller "strukturerna" som uppstod i kunskapsgrafen. De undrade om det fanns något slags naturfenomen som orsakade de olika strukturerna i citeringsnätverken. Dessutom ville de se till att data som användes i deras reproducerbarhetsförutsägelser inte påverkades av fördomar i data. Pujara sa, "Kristina [Lerman] hade idén att titta på kovariater som kön eller prestige." Och med den idén gav sig forskargruppen ut för att se om det fanns någon skillnad i ett nätverk baserat på om författaren var en man eller en kvinna, samt om de var på ett högst rankat universitet eller ett lägre rankat universitet.
Vem, vad och varför för citat
Innan vi går vidare, lite info om hur citering i vetenskaplig forskning fungerar. Det finns vanligtvis tre anledningar till att en författare kan citera en annan författares papper.
Först, som bakgrund – för att förstå sitt papper kommer en författare att citera andra papper som ger den bakgrundsinformation som behövs. För det andra, för att förklara en metod – om en författare använde en metod som liknar, en version av eller jämförbar med en metod från en annan artikel kommer de att citera den artikel som förklarar den metoden. Och för det tredje, resultat - en författare kommer att förklara sina resultat, men kan citera andra artiklar som studerade samma sak men fick andra resultat.
Hämta information från citat
"Att försöka studera citeringsnätverket för varje forskare där ute är verkligen svårt, så varför väljer vi inte grädden?" sa Pujara. Teamet tittade på forskare invalda i U.S. National Academy of Sciences (NAS), en av de äldsta och mest framstående professionella vetenskapsorganisationerna. Nya medlemmar av NAS väljs av nuvarande medlemmar baserat på en framstående rekord av vetenskapliga prestationer, vilket innebär att de i teorin alla har nått samma nivå av erkännande. ISI-teamet tittade på 766 NAS-forskare, varav 120 var kvinnor, med en hypotes om att komplexa könsskillnader skulle vara synliga inom denna grupp av elitforskare.
Deras hypotes visade sig vara korrekt.
De konstruerade citeringsnätverk som fångade strukturen för peer-igenkänning för varje NAS-medlem. Dessa strukturer skilde sig markant mellan manliga och kvinnliga NAS-medlemmar. Kvinnors nätverk var mycket tätare klustrade, vilket tyder på att en kvinnlig forskare måste vara mer socialt inbäddad och ha ett starkare stödnätverk än sina manliga motsvarigheter. Skillnaderna var tillräckligt systemiska för att tillåta medlemmens kön att klassificeras korrekt baserat på enbart deras citeringsnätverk.
Lerman sa:"Vi skulle kunna skriva en AI-algoritm som bara skulle titta på citeringsnätverken och förutsäga om detta var citeringsnätverket för en kvinna eller en man. Detta var ganska chockerande och en besvikelse för oss."
Som en kontrollstudie tittade teamet också på prestigekovariaten. NAS-medlemmar som är knutna till mindre prestigefyllda institutioner är en minoritet inom NAS, i likhet med kvinnor. Lerman sa, "vi skulle ha föreställt oss att kanske kvinnors citeringsnätverk skulle se ut som medlemmar från icke-prestigefyllda universitet." Men så var inte fallet. De observerade inga skillnader på grund av prestigen hos en medlems institutionell tillhörighet.
Slutsats:baserat på enbart en vetenskapsmans citeringsnätverk kan kön bestämmas exakt, men prestigen för det universitet som vetenskapsmannen är knuten till kan inte. Detta tyder på att kön fortsätter att påverka karriärframgång inom vetenskap, enligt ISI-teamet.
Hur man slutar vara så kortciterad
Varför händer det här? Pujara sa:"Vi vet inte. Det kan bero på att det finns någon aspekt av kön som förändrar samarbetsbeteende. Eller så kan det vara något med samhället som formar forskare och deras vägar baserat på sociala fördomar. Så vi vet faktiskt inte svar på det. Vad vi vet är att det finns en skillnad."
Den verkliga frågan är:hur kan vi ändra det? Hur kan vi göra vetenskapen till ett mindre fientligt klimat för kvinnor, ta bort hindren för kvinnors möjligheter och skapa en miljö som gör att kvinnor kan ta sig till toppen av sina områden?
ISI-teamet hoppas att deras metoder och resultat kan hjälpa. Till att börja med kan den här studien användas för att hjälpa forskare att förstå hur deras nätverk ser ut. Dessutom skulle det kunna användas som ett sätt för beslutsfattare att förstå om program som syftar till att förbättra jämställdhet mellan könen inom vetenskapen fungerar.
Slutligen, och viktigare, kan vi lära oss av dessa skillnader i citeringsstrukturerna mellan män och kvinnor. "För att en kvinna ska bli erkänd måste hon vara väl inbäddad och ha ett starkt stödnätverk," sa Lerman. "Att mentorera unga kvinnor och tala om för dem att de verkligen måste bygga dessa nätverk av socialt stöd och vara mycket avsiktliga om dem" verkar vara ett sätt att ändra formen på dessa strukturer... och formen på vetenskap. + Utforska vidare