Alessia Iancarelli, doktorand i Northeasterns Affective and Brain Sciences-labb. Kredit:Alyssa Stone/Northeastern University
Om du vill bli vetenskapsman måste du läsa mycket.
Vetenskap är en strävan fokuserad på att bygga och dela kunskap. Forskare publicerar artiklar som beskriver deras upptäckter, genombrott och innovationer för att dela dessa avslöjanden med kollegor. Och det finns miljontals vetenskapliga artiklar varje år.
Att hänga med i den senaste utvecklingen inom sitt område är en utmaning för forskare på alla punkter i karriären, men det påverkar särskilt forskare i tidiga karriärer, eftersom de också måste läsa de många artiklar som utgör grunden för deras område.
"Det är omöjligt att läsa allt. Absolut omöjligt," Ajay Satpute, chef för Affective and Brain Science Lab och biträdande professor i psykologi vid Northeastern. "Och om du inte vet allt som har hänt på fältet, finns det en reell chans att återuppfinna hjulet om och om och om igen." Utmaningen, säger han, är att ta reda på hur man ska utbilda nästa generations forskare ekonomiskt, och att balansera behovet av att läsa alla viktiga uppsatser med att utbilda dem som forskare i sin egen rätt.
Den uppgiften blir bara svårare, säger Alessia Iancarelli, en doktorand som studerar affektions- och socialpsykologi i Satputes labb. "Mängden publicerad litteratur bara ökar", säger hon. "Hur kan forskare utveckla sina stipendier inom ett område med tanke på denna enorma mängd litteratur?" De måste välja och vraka vad de ska läsa.
Men vanliga tillvägagångssätt för den prioriteringen, säger Iancarelli, kan införliva fördomar och utelämna avgörande hörn av fältet. Så Iancarelli, Satpute och kollegor utvecklade en maskininlärningsmetod för att hitta ett bättre – och mindre partiskt – sätt att göra en läslista. Deras resultat, som publicerades förra veckan i tidskriften PLOS One , bidrar också till att minska könsfördomar.
"Det finns verkligen ett problem med hur vi utvecklar stipendium," säger Satpute. Just nu använder forskare ofta ett sökverktyg som Google Scholar på ett ämne och börjar därifrån, säger han. "Eller, om du har tur, får du en underbar instruktör och har en bra kursplan. Men det kommer i grunden att vara fältet genom den personens ögon. Så jag tror att det här verkligen fyller en nisch som kan bidra till att skapa balans och tvärvetenskapligt stipendium utan att nödvändigtvis ha tillgång till en underbar instruktör, för det är inte alla som får det."
Problemet med något som Google Scholar, förklarar Iancarelli, är att det kommer att ge dig de mest populära artiklarna inom ett område, mätt efter hur många andra artiklar som har citerat dem. Om det finns delmängder av det fältet som inte är lika populära men fortfarande är relevanta, kan viktiga artiklar om dessa ämnen missas med en sådan sökning.
Ta till exempel ämnet aggression (vilket är ämnet forskarna fokuserade på för att utveckla sin algoritm). Medier och videospel är ett särskilt hett ämne inom aggressionsforskning, säger Iancarelli, och därför finns det mycket fler artiklar om den delmängden av fältet än om andra ämnen, som testosteronets roll och social aggression.
Så Iancarelli bestämde sig för att gruppera uppsatser på ämnet aggression i samhällen. Med hjälp av citeringsnätverksanalys identifierade hon 15 forskningsgemenskaper om aggression. Istället för att titta på det obearbetade antalet gånger en artikel har citerats i en annan forskningsartikel, bestämmer algoritmen en gemenskap av papper som tenderar att citera varandra eller samma kärnuppsättning av papper. De största samhällena som den avslöjade var media och videospel, stress, egenskaper och aggression, idisslande och fördriven aggression, testosteronets roll och social aggression. Men det fanns också några överraskningar, som en mindre grupp av forskningsartiklar fokuserade på aggression och hästar.
"Om du använder communitydetektion får du denna riktigt rika, granulära titt på aggressionsfältet," säger Satpute. "Du har ett slags fågelperspektiv över hela fältet snarare än att [det verkar som] att aggressionsfältet i grunden är media, videospel och våld."
Förutom att diversifiera ämnena som presenteras genom att använda denna gemenskapsmetod, fann forskarna också att andelen artiklar med kvinnliga förstaförfattare som dubbades inflytelserika av algoritmen fördubblades jämfört med när de bara fokuserade på det totala antalet citat. (Iancarelli tillägger att det kan finnas vissa fördomar inbakade i det resultatet, eftersom teamet inte kunde fråga författarna direkt om deras könsidentitet och istället var tvungna att förlita sig på antaganden baserade på författarens namn, bild och eventuella pronomen som användes för att referera till dem .)
Teamet har släppt koden bakom denna algoritm så att andra kan använda den och replikera sin metod för citeringsnätverksanalys inom andra forskningsområden.
För Iancarelli finns det en annan motivation:"Jag skulle älska att använda det här arbetet för att skapa en kursplan och undervisa i min egen kurs om mänsklig aggression. Jag skulle verkligen älska att basera kursplanen på de mest relevanta artiklarna från varje annan gemenskap för att ge en sann general syn på det mänskliga aggressionsfältet."