En liten del av ett släktträd som täcker 13 generationer som härleddes av algoritmen. Färgerna visar individens socioekonomiska status. Kredit:Eric Malmi
Det skulle ta 100 årsverken för en släktforskare att kartlägga och hitta alla föräldrar för fem miljoner människor – med en takt på en person per minut. AncestryAI-algoritmen kan göra samma arbete på en timme med 50 parallella datorer och med en framgångsfrekvens på 65 procent. Algoritmen kan också mäta osäkerhetsnivån för varje anslutning så att opålitliga resultat kan ignoreras. Släktforskare och demografer kan använda algoritmen för att belysa samhällsförändringar och historia.
”Algorithmen ersätter inte släktforskarnas arbete; det är helt enkelt ett verktyg för att hjälpa dem i deras arbete. Släktforskningsalgoritmen kan föreslå samband som förmodligen är korrekta, men i sig är den inte lika exakt som en noggrann släktforskare. Algoritmen kan också söka efter föräldrar från rikstäckande data, medan en släktforskare kan behöva begränsa sin sökning till bara en församling, förklarar Eric Malmi, doktorand vid Aalto-universitetet som för närvarande arbetar för Google i Zürich.
Använder AncestryAI, lanserades 2017, släktforskare har verkligen lyckats hitta nya förfäder, till exempel familjeband mellan med individer av vilka några har flyttat till olika regioner i Finland. För närvarande, AncestryAI används för att härleda de genealogiska relationerna för personer som dog i finska inbördeskriget 1918 för att ge, till exempel, en mer exakt uppskattning av antalet krigsföräldralösa barn.
Klassdelningen i Finland förblev oförändrad i 150 år
Släktforskningsalgoritmen hjälper till att undersöka enorma mängder data för att analysera sociala förändringar under långa tidsperioder snarare än vid endast särskilda och snäva tidsramar. Malmis arbete har bekräftat, till exempel, att klassdelningen i Finland förblev så gott som oförändrad mellan 1735 och 1885.
”Vi studerade effekten av socioekonomisk status på valet av make och fann att de hänger tydligt ihop. Mot våra förväntningar, dock, styrkan på anslutningen minskade inte med tiden, utan snarare förblev detsamma, förklarar Malmi.
Socioekonomisk status härleddes utifrån yrket som en makes far. Drängar och andra jordlösa bönder representerade den lägsta klassen, och resten delades sedan i arrendatorer, bönder, medelklass och överklass.
AncestryAI använder sig av statistiska avdrag och maskininlärningsprocedurer utvecklade för genealogisk användning. Den grundläggande algoritmen strävar efter att separat härleda mamman och pappan för varje individ baserat på deras namn, ort och födelsedatum. En kompletterande algoritm förbättrar sedan noggrannheten hos den grundläggande algoritmen genom att ta hänsyn till andra faktorer, som att folk oftast har barn med samma make.
AncestryAI använder data i HisKi-databasen som underhålls av Genealogical Society of Finland. Uppgifterna består av totalt 5 miljoner födslar och 3,3 miljoner dödsfall under 1648–1918. Algoritmen har gjort totalt 7,3 miljoner kopplingar mellan barn och deras föräldrar.