Utredare som försöker identifiera en okänd person kan tillbringa månader med att kamma igenom massiva släktträd. Kredit:Cory Hall
I nästan 37 år var hon känd som Buckskin Girl - ett ungt, anonymt mordoffer som hittats utanför Dayton, Ohio, klädd i en poncho med hjortskinn. Sedan, i april 2018, meddelade polisen att mysteriet med hennes identitet hade lösts. Hennes namn var Marcia L. King, och hon hade identifierats genom att koppla en bit av hennes DNA till en av hennes kusiner.
Det var ett av de första uppmärksammade fallen där denna undersökningsmetod hade använts för att identifiera en kropp som inte gjorts anspråk på. Två veckor efter att Kings namn avslöjades meddelade polisen i Kalifornien att de hade använt liknande tekniker för att spåra upp Golden State-mördaren. Plötsligt hyllades kombinationen av genetisk provtagning, släktforskning och gammaldags gumshoeing som ett revolutionerande genombrott som skulle knäcka hundratals förkylningsfall.
Sedan dess har rättsgenetisk genealogi klarat mer än 400 fall i USA. Ändå är detta detektivarbete komplext och tidskrävande. Medan King identifierades efter bara några timmars undersökning tar de flesta fall mycket längre tid. I genomsnitt tar de över ett år att lösa framgångsrikt. Många lämnas oavslutade:Brottsbekämpande myndigheter kan få slut på finansiering innan en person kan identifieras och utredare kan ge upp om de hamnar i för många återvändsgränder.
Ett mer systematiskt tillvägagångssätt skulle hjälpa, säger Lawrence Wein, professor i drift, information och teknologi vid Stanford Graduate School of Business. Med Mine Su Ertürk, Ph.D., har han avslöjat en metod för att lösa kalla fall med snabbare och mer framgång. I en ny artikel i Journal of Forensic Sciences , presenterar de den första detaljerade matematiska analysen av den rättsgenetiska genealogiprocessen och skisserar ett sätt för utredare att optimera sökningar efter okända offer eller brottsmisstänkta.
För att utveckla sin sökmetod gick Wein och Ertürk ihop med DNA Doe Project, en ideell organisation i Kalifornien som har löst mer än 65 fall av oidentifierade kvarlevor, inklusive King-fallet. Det gav forskarna data från 17 fall, inklusive 8 som var olösta vid den tiden. "Det är ganska likt det historiska genomsnittet av fall de har löst," säger Wein. "Så det finns ingen anledning att misstänka att dessa fall är mycket svårare eller mycket enklare än slumpmässigt utvalda fall."
Med hjälp av dessa verkliga data tittade Wein och Ertürk på hur rättsgenetiska släktforskningar vanligtvis görs och testade sedan deras metod, som syftar till att maximera sannolikheten att hitta en lösning på kortast möjliga tid. "Det visar sig vara mycket snabbare," säger Wein om det nya tillvägagångssättet - nästan 10 gånger snabbare. "Om de bara löser ett litet antal ärenden med den nuvarande metoden och vi kan få dem att lösa dem 10 gånger snabbare, då skulle de kunna lösa många fler fall."
En skog av släktträd
En typisk genetisk släktforskning börjar med ett DNA-prov från ett "mål" som en oidentifierad kropp eller en mordmisstänkt. Den laddas upp till en DNA-databas som GEDmatch eller FamilyTreeDNA, som genererar en lista med "matchningar" - personer som delar delar av målets genom. En sökning kan hitta hundratals av dessa matchningar, vanligtvis avlägsna kusiner vars gemensamma förfäder kan ha dött för mer än ett sekel sedan. Fallen Wein och Ertürk analyserade hade mellan 200 och 5 000 matchningar.
Det är bara början:Att dra en linje från dessa långt borta släktingar till målet kräver att man bygger ett släktträd som inkluderar så många familjemedlemmar som möjligt. Även här är problemets omfattning skrämmande. "Det här är enorma träd," säger Wein. "Det är verkligen svårt att visuellt lägga ut något större än ett par dussin personer." När trädet expanderar förbättras oddsen för att identifiera målet – men längden på sökningen ökar också.
Därefter måste de relevanta personerna i trädet identifieras. Detta kräver genomsökning av offentliga register, släktforskningssajter och sociala medier – tidskrävande benarbete som kombinerar intuition och skicklighet. "Det finns en hel konst i det", säger Wein. "Att använda äktenskapshandlingar och dödshandlingar och födelsehandlingar och Facebook och alla möjliga olika register för att försöka ta reda på vilka människor är och vilka deras förfäder och avkommor är."
Det är inte direkt uppenbart vilka matcher som ger den bästa vägen till målet. Utredarnas strategier för att följa dessa ledtrådar tenderar att vara decentraliserade, säger Wein. "Du har ett team av människor som gör det här och var och en kommer att bestämma sig för att ta en match för att undersöka, och sedan kommer de att gå iväg på egen hand för att försöka bygga ett släktträd bakåt i tiden från varje match. De tänker inte om den stora bilden holistiskt."
Genom att ta ett steg tillbaka och utvärdera hela problemet ger Wein och Ertürk en färdplan för genetiska släktforskare som söker den mest effektiva vägen till ett oidentifierat mål. "I grund och botten säger vi till dem:"Med tanke på var du befinner dig i sökningen just nu är det här vad du ska göra härnäst", säger Wein.
Lösa ekvationer och brott
Att förklara skillnaden mellan den nya sökmetoden och standardmetoden eller "benchmark"-metoden är komplicerat, men Wein kokar ner det till detta:"Benchmarkmetoden letar efter gemensamma förfäder mellan olika matchningar. Det du verkligen vill hitta är mest nyligen gemensam förfader mellan en match och det okända målet, och det är ett lite annorlunda problem." Den senaste gemensamma förfadern till första kusiner, till exempel, är en morförälder; andra kusiner delar en farfarsförälder och så vidare.
Efter att ha identifierat en lista över möjliga senaste gemensamma förfäder, fyller Wein och Ertürks metod "aggressivt" i släktträdet med sina ättlingar, även om det bara finns en liten chans att målets förfader finns med på listan.
Detta språng uppnås genom att använda sannolikhetsteori för att spåra sökningens framsteg. "Vi gör detta genom att beskriva det rekonstruerade släktträdet som en samling av sannolikheter som representerar hur sannolikt varje person på vårt träd är att vara en korrekt förfader till målet", förklarar Ertürk. "Sedan när du tittar på dessa sannolikheter kan du se vilka delar av trädet du bör utforska mer."
Detta tillvägagångssätt visar sig vara effektivt även med mindre släktträd, vilket innebär snabbare lösningstider. Efter att ha kört hundratals simulerade sökningar drar Wein och Ertürk slutsatsen att deras metod kan lösa ett fall med ett släktträd på 7 500 personer runt 94 % av tiden. Standardmetodens framgångsgrad i dessa fall är cirka 4%.
Wein hoppas att dessa fynd kommer att hjälpa DNA Doe Project och andra utredare att förfina sitt tillvägagångssätt och knäcka fler fall. Han noterar att hans analys inte tar hänsyn till några av de "trick" som genetiska utredare använder för att begränsa sina sökningar, som att fokusera på familjemedlemmar som bodde på en viss plats. "Vår algoritm är inte på något sätt tänkt att ersätta släktforskare", säger han. "Men om de verkligen har fastnat kommer det att ge dem några idéer som kanske inte är uppenbara."
Wein och Ertürk har använt matematik för att ta itu med undersökande utmaningar tidigare. Förra året skrev Ertürk ett dokument med Stanford GSB-professor Kuang Xu som beskrev en metod för genetisk sökning som balanserar effektivitet och integritetsproblem. Wein har undersökt bättre sätt att skanna fingeravtryck, bearbeta kit för sexuella övergrepp och spåra kulor.
Han ser rättsgenetisk släktforskning som ett annat brottslösande verktyg som kan förbättras så att det kan leva upp till sitt löfte. "Det är ett intressant område som kombinerar sannolikhet och statistik och optimering och ibland spelteori", säger han. "Det var så jag, ur en matematisk synvinkel, förblev attraherad av de här problemen." + Utforska vidare