Kredit:CC0 Public Domain
Allas DNA-sekvens är unik. Men för dem som vill behålla sin genetiska integritet, det kanske inte är unikt nog.
En ny studie hävdar att mer än hälften av amerikanerna skulle kunna identifieras med namn om allt du behövde börja med var ett prov av deras DNA och några grundläggande fakta, som var de bor och hur gamla de kan vara.
Det skulle inte vara enkelt, och det skulle inte vara billigt. Men det faktum att det har blivit genomförbart kommer att tvinga oss alla att ompröva betydelsen av privatliv i DNA-åldern, sa experter.
Det finns lite tid att slösa. Forskarna bakom den nya studien säger att när 3 miljoner amerikaner har laddat upp sina genom till offentliga släktforskningswebbplatser, Nästan alla i USA skulle kunna identifieras enbart genom sitt DNA och bara några ytterligare ledtrådar.
Mer än 1 miljon amerikaner har redan publicerat sin genetiska information, och dussintals fler gör det varje dag.
"Folk har undrat hur lång tid det kommer att ta innan du kan använda DNA för att upptäcka nästan vem som helst, sa Ruth Dickover, chef för det kriminaltekniska programmet vid University of California, Davis som inte var involverad i studien. "Författarna säger att det inte kommer att ta så lång tid."
Denna nya verklighet representerar konvergensen av två långvariga trender.
En av dem är uppkomsten av genetiska tester direkt till konsument. Företag som Ancestry.com och 23andMe kan sekvensera allas DNA för cirka 100 dollar. Allt du behöver göra är att ge ett prov på saliv och skicka det med posten.
Det andra väsentliga elementet är spridningen av offentligt sökbara släktforskningsdatabaser som GEDmatch. Vem som helst kan ladda upp ett fullständigt genom till dessa platser och kraftfulla datorer kommer att knasa igenom det, letar efter sträckor av matchande DNA-sekvenser som kan användas för att bygga ut ett släktträd.
För att testa den växande kraften hos dessa webbplatser, forskare under ledning av Columbia Universitys datavetare Yaniv Erlich gav sig ut för att se om de kunde hitta en persons namn – och därmed hans identitet – om allt de behövde gå vidare var en bit av hans DNA och en liten mängd biografisk information.
De började med en fullständig DNA-sekvens från en person vars genetiska information publicerades anonymt som en del av en orelaterade vetenskaplig studie. (De hade faktiskt identifierat denna kvinna i en tidigare studie, men för detta arbetes syften, de låtsades att de inte visste vem hon var.)
Erlich och hans medarbetare laddade upp hennes genetiska kod till GEDmatch och gjorde en sökning för att se om hon hade några släktingar på webbplatsen. De hittade två:en i North Dakota och en i Wyoming.
Forskarna kunde säga att de alla var släkt eftersom de delade ett antal enkelnukleotidpolymorfismer, eller SNP:er. Det här är enstaka bokstäver på specifika ställen bland de cirka 3 miljarder A, Cs, Ts och Gs som utgör det mänskliga genomet.
Ju fler SNP folk delar, desto närmare släkt är de.
Genom att jämföra DNA från alla tre släktingar, Erlichs team lyckades hitta ett gemensamt förfäderpar som var Utah-kvinnans farfarsföräldrar.
Nästa, forskarna letade igenom släktforskningswebbplatser och andra källor efter ytterligare ättlingar till det för länge sedan paret. De hittade 10 barn och hundratals barnbarn och barnbarnsbarn.
Sedan började de slå ut sin enorma lista med ättlingar. De eliminerade alla män från provet, sedan de som inte levde när Utah-kvinnans DNA sekvenserades. Författarna visste också att deras ämne var gift och hur många barn hon hade, vilket hjälpte dem att nå målet.
Efter en lång dag av mödosamt arbete, forskarna kunde korrekt namnge ägaren till DNA-provet.
Författarna sa att samma process skulle fungera för cirka 60 procent av amerikaner med europeisk härkomst, vilka är de personer som mest sannolikt använder genealogiska webbplatser, sa Erlich. Även om chanserna att lyckas skulle vara lägre för människor med annan bakgrund, det skulle fortfarande förväntas fungera för mer än hälften av alla amerikaner, sa de.
För att komma till denna slutsats, forskarna analyserade en annan databas bestående av 1,28 miljoner anonyma individer som fick sitt DNA sekvenserat av MyHeritage, ett DNA-testnings- och familjehistoriskt företag där Erlich är chief science officer.
Om du kan hitta en persons tredje kusin i en genealogisk databas, då borde du kunna identifiera personen med en rimlig mängd letande, sa Erlich. Så teamet kollade för att se hur många släktingar i storleksordningen en tredje kusin eller närmare de kunde hitta för varje individ i sin datauppsättning.
De fann massor:60 procent av de 1,28 miljoner människorna matchades med en släkting som var minst lika nära som en tredje kusin, och 15 procent hade en släkting som var minst lika nära som en andra kusin.
Resultaten publicerades på torsdagen i tidskriften Vetenskap .
Än så länge, 72-årige Joseph James DeAngelo är den mest kända personen som identifierats på detta sätt. Du kanske känner honom bättre som den misstänkte Golden State-mördaren, åtalad för 13 fall av mord och 13 fall av försök till kidnappning.
När brottsbekämpande tjänstemän använde en allmänt tillgänglig DNA-databas för att fånga DeAngelo i april, det var bara andra gången i brottslösningshistorien som strategin implementerades framgångsrikt.
Sedan dess, minst 13 ytterligare misstänkta brottslingar har identifierats på samma sätt.
"Lösningen av Golden State Killer-fallet öppnade upp den här metoden som en möjlighet och andra kriminallaboratorier drar nytta av det, "Dickover sa. "Det är klart att en trend har börjat."
Även privata medborgare drar nytta av tekniken. Adopterade har hittat biologiska föräldrar och syskon, och andra har hittat avlägsna kusiner som kan kasta nytt ljus över en familjs ursprung och arv.
Men när fler av oss laddar upp DNA till offentligt sökbara databaser, konsekvenserna kan vara läskiga.
"När polisen fångade Golden State Killer, det var en mycket bra dag för mänskligheten, " Sa Erlich. "Problemet är att samma strategi kan missbrukas."
Tänk på utländska regeringar som använder denna teknik för att spåra upp amerikanska medborgare, han sa. Eller demonstranter och aktivister som förföljs på detta sätt.
Erlich och hans medförfattare föreslog en begränsningsstrategi som skulle göra det svårare att ladda upp en okänd DNA-sekvens till en genealogisk databas och söka efter en matchning.
De föreslår att direkt-till-konsument-DNA-testföretag sätter en speciell kod på de rådatafiler som de skickar till sina kunder. Släktforskningssajter kan då komma överens om att tillåta människor att ladda upp DNA-sekvenser endast om de har en giltig kod. Detta skulle säkerställa att människor kunde utföra sökningar som endast är relaterade till deras eget DNA.
Ett system som detta skulle inte hindra brottsbekämpande myndigheter från att använda genealogiska databaser för att söka efter misstänkta, sa Erlich.
Det yttersta målet är att låta människor använda sitt DNA för att ta reda på mer om sina egna familjer utan att offra sin integritet, sa Erlich.
Bara i år, hans adopterade kusin hittade en biologisk syster som bor halvvägs runt om i världen, han sa.
"Det är därför vi har den här tekniken, " han sa.
©2018 Los Angeles Times
Distribueras av Tribune Content Agency, LLC.