DNA-testtjänster gör det lättare för människor att lära sig om sitt arv. Människor kan också använda sina genetiska testresultat för att ansluta till potentiella släktingar i sina släktträd genom att använda webbplatser från tredje part, som GEDmatch, där de kan jämföra sina DNA-sekvenser med andra i databasen. Kredit:Marco Verch/Flickr
DNA-testtjänster som 23andMe, Ancestry.com och MyHeritage gör det lättare för människor att lära sig om sitt etniska arv och genetiska sammansättning. Människor kan också använda genetiska testresultat för att ansluta till potentiella släktingar genom att använda webbplatser från tredje part, som GEDmatch, där de kan jämföra sina DNA -sekvenser med andra i databasen som har laddat upp testresultat.
Men ett mindre lyckligt slut är också möjligt. Forskare vid University of Washington har funnit att GEDmatch är sårbart för flera typer av säkerhetsrisker. En motståndare kan bara använda ett litet antal jämförelser för att extrahera någons känsliga genetiska markörer. En skadlig användare kan också konstruera en falsk genetisk profil för att efterlikna någons släkting.
Teamet publicerade sina resultat 29 oktober. Forskarna har också fått denna forskning accepterad vid Network and Distributed System Security Symposium och kommer att presentera dessa resultat i februari i San Diego.
"Folk tänker på genetisk data som personlig – och det är det. Det är bokstavligen en del av deras fysiska identitet, " sa huvudförfattaren Peter Ney, en postdoktor vid UW Paul G. Allen School of Computer Science &Engineering. "Detta gör integriteten för genetiska data särskilt viktig. Du kan ändra ditt kreditkortsnummer men du kan inte ändra ditt DNA."
Den vanliga användningen av genetiska testresultat för släktforskning är ett relativt nytt fenomen. De initiala fördelarna kan ha skymt vissa underliggande risker, säger forskarna.
"När vi har en ny teknik, oavsett om det är smarta bilar eller medicinsk utrustning, vi som samhälle börjar med "Vad kan det här göra för oss?" Sedan börjar vi titta på det ur ett kontradiktoriskt perspektiv, " sa medförfattaren Tadayoshi Kohno, en professor i Allen School. "Här tittar vi på det här systemet och frågar:'Vilka är integritetsproblemen förknippade med att dela genetisk data online?'"
UW-forskare fann att en motståndare bara kan använda ett litet antal jämförelser på GEDmatch för att extrahera känsliga genetiska markörer för någon och konstruera en falsk genetisk profil för att imitera någons släkting. Här visas en genetisk stamtavla över två föräldrar med två barn. Då hävdar ett annat barn (rött) falskt att vara släkt med pappan. Kredit:Rebecca Gourley/University of Washington
För att leta efter säkerhetsproblem, teamet skapade ett forskningskonto på GEDmatch. Forskarna laddade upp experimentella genetiska profiler som de skapade genom att blanda och matcha genetisk data från flera databaser med anonyma profiler. GEDmatch tilldelade dessa profiler ett ID som människor kan använda för att göra en-till-en-jämförelser med sina egna profiler.
För en-till-en jämförelser, GEDmatch producerar grafik med information om hur mycket av de två profilerna som matchar. En grafik är en stapel för var och en av de 22 icke-könade kromosomerna. Varje stapel ändrar längd beroende på hur lika de två profilerna är för den kromosomen. En längre stapel visar att det finns fler matchande regioner, medan en serie kortare staplar betyder att det finns korta områden av likhet varvat med områden som är olika.
Teamet ville veta om en motståndare kunde använda den baren för att ta reda på en specifik DNA -sekvens inom en region av ett målprofil, såsom om målet har en mutation eller inte som gör dem mottagliga för en sjukdom. För denna sökning, teamet designade fyra "extraktionsprofiler" som de kunde använda för en-till-en-jämförelser med en målprofil som de skapade. Baserat på om stapeln stannade i ett stycke – vilket indikerar att extraktionsprofilen och målet matchade – eller delade i två staplar – vilket indikerar ingen matchning – kunde teamet härleda målets specifika sekvens för den regionen.
"Genetisk information korrelerar med medicinska tillstånd och potentiellt andra djupt personliga egenskaper, " sa medförfattaren Luis Ceze, en professor i Allen School. "Även i en tidsålder av att sprida information, det här är troligen den typ av information man inte vill dela för juridiskt, medicinska och psykiska skäl. Men när mer genetisk information blir digital, riskerna ökar."
Därefter undrade forskarna om en motståndare kunde använda en liknande teknik för att få ett måls hela profil. Teamet fokuserade på en annan GEDmatch-grafik som beskriver hur väl profilerna matchar genom att visa en linje med färgade pixlar som markerar hur väl varje DNA-segment i frågan matchar målet:grönt för en fullständig matchning, gul för en halv match – när en DNA-sträng matchade men inte den andra – och röd för ingen matchning.
Sedan spelade laget ett spel med 20 frågor:De skapade 20 extraktionsprofiler som de använde för en-till-en-jämförelser på en målprofil som de skapade. Baserat på hur pixelfärgerna ändrades, de kunde ta fram information om målsekvensen. För fem testprofiler, forskarna extraherade cirka 92% av ett tests unika sekvenser med cirka 98% noggrannhet.
För en-till-en jämförelser, GEDmatch producerar en stapel för var och en av de 22 icke-könade kromosomerna som ändrar längd beroende på hur lika de två profilerna är för den kromosomen. Här visas ett exempel på denna grafik. En längre stapel visar att det finns fler matchande regioner (överst), medan en serie kortare staplar betyder att det finns korta områden av likhet varvat med områden som är olika (nederst). Kredit:Rebecca Gourley/University of Washington
"Så i princip, allt motståndaren behöver göra är att ladda upp dessa 20 profiler och sedan göra 20 en-till-en-jämförelser med målet, " sa Ney. "De kunde skriva ett program som automatiskt gör dessa jämförelser, laddar ner data och returnerar resultatet. Det skulle ta 10 sekunder."
När någons profil avslöjas, motståndaren kan använda den informationen för att skapa en profil för en falsk släkting. Teamet testade detta genom att skapa ett falskt barn för en av deras experimentella profiler. Eftersom barn får hälften av sitt DNA från varje förälder, det falska barnets profil hade deras DNA-sekvenser som hälften matchade föräldraprofilen. När forskarna gjorde en en-till-en-jämförelse av de två profilerna, GEDmatch uppskattade en förälder-barn relation.
En motståndare kan skapa vilken falsk relation de vill genom att ändra andelen delat DNA, sa laget.
"Om GEDmatch-användare har oro för integriteten för deras genetiska data, de har möjlighet att ta bort det från webbplatsen, "Ney sa." Valet att dela data är ett personligt beslut, och användare bör vara medvetna om att det kan finnas en viss risk när de delar data. Säkerhet är ett svårt problem för internetföretag i alla branscher."
Innan de publicerar sina resultat, forskarna delade med sig av sina resultat med GEDMatch, som har arbetat för att lösa dessa problem, enligt GEDmatch-laget. UW -forskarna är inte anslutna till GEDmatch, dock, och kan inte kommentera detaljerna i några korrigeringar.
"Vi börjar bara skrapa på ytan, " sade Kohno. "Dessa upptäckter är så grundläggande att folk kanske redan gör detta och vi vet inte om det. Det ansvariga för oss är att avslöja våra resultat så att vi kan engagera en gemenskap av forskare och beslutsfattare i en diskussion om hur man kan mildra denna fråga."