• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Vad är differentiell integritet och hur kan det skydda dina data?

    Teknikföretag kan använda differentiell integritet för att samla in och dela aggregerad data om användarvanor, samtidigt som individuell integritet bevaras. Kredit:Tim Snell/Flickr, CC BY-ND

    Det är ingen hemlighet att stora teknikföretag som Facebook, Google, Apple och Amazon infiltrerar allt mer våra personliga och sociala interaktioner för att samla in enorma mängder data om oss varje dag. På samma gång, integritetskränkningar i cyberrymden gör regelbundet nyheter på förstasidan.

    Så hur ska integriteten skyddas i en värld där data samlas in och delas med ökande hastighet och uppfinningsrikedom?

    Differentiell integritet är en ny modell för cybersäkerhet som förespråkare hävdar kan skydda personuppgifter mycket bättre än traditionella metoder.

    Matematiken den är baserad på utvecklades för 10 år sedan, och metoden har anammats av Apple och Google de senaste åren.

    Vad är differentiell integritet?

    Differentiell integritet gör det möjligt för teknikföretag att samla in och dela aggregerad information om användarvanor, samtidigt som enskilda användares integritet bibehålls.

    Till exempel, säg att du ville visa de populäraste vägarna folk tar när de går genom en park. Du spårar rutter för 100 personer som regelbundet går genom parken, och om de går på stigen eller genom gräset.

    Men istället för att dela de specifika personerna som tar varje väg, du delar den samlade data som samlats in över tiden. Personer som tittar på dina resultat kanske vet att 60 av 100 personer föredrar att ta en genväg genom gräset, men inte vilka 60 personer.

    Varför behöver vi det?

    Många av världens regeringar har strikta policyer om hur teknikföretag samlar in och delar användardata. Företag som inte följer reglerna kan få höga böter. En belgisk domstol beordrade nyligen Facebook att sluta samla in data om användares surfvanor på externa webbplatser, eller riskera böter på 250 €, 000 om dagen.

    För många företag, särskilt multinationella företag som verkar i olika jurisdiktioner, detta lämnar dem i en känslig position när det gäller insamling och användning av kunddata.

    Å ena sidan, dessa företag behöver användarnas data så att de kan tillhandahålla tjänster av hög kvalitet som gynnar användarna, som personliga rekommendationer. Å andra sidan, de kan bli åtalade om de samlar in för mycket användardata, eller om de försöker flytta data från en jurisdiktion till en annan.

    Traditionella integritetsbevarande verktyg som kryptografi kan inte lösa detta dilemma eftersom det hindrar teknikföretag från att överhuvudtaget komma åt data. Och anonymitet minskar värdet av data – en algoritm kan inte ge dig personliga rekommendationer om den inte vet vilka dina vanor är.

    Kredit:Marco Verch/Flickr, CC BY

    Hur fungerar det?

    Låt oss fortsätta exemplet med vandringsleder genom en park. Om du känner till identiteten på de som ingår i studien, men du vet inte vem som tog vilken väg då du kan anta att integriteten är skyddad. Men så kanske inte är fallet.

    Säg att någon som tittar på din data vill ta reda på om Bob föredrar att gå genom gräset eller på stigen. De har fått bakgrundsinformation om de andra 99 personerna i studien, som säger att 40 personer föredrar att gå på stigen och 59 föredrar att gå genom gräset. Därför, de kan dra slutsatsen att Bob, vem är den 100:e personen i databasen, är den 60:e personen som föredrar att gå genom gräset.

    Denna typ av attack kallas en differentierad attack, och det är ganska svårt att försvara sig mot då man inte kan kontrollera hur mycket bakgrundskunskap någon kan få. Differentiell integritet syftar till att försvara sig mot denna typ av attack.

    Någon som härleder din vandringsväg kanske inte låter alltför allvarlig, men om du ersätter gångvägar med hiv-testresultat, då kan du se att det finns potential för ett allvarligt intrång i integriteten.

    Den differentiella integritetsmodellen garanterar att även om någon har fullständig information om 99 av 100 personer i en datamängd, de kan fortfarande inte härleda informationen om den sista personen.

    Den primära mekanismen för att uppnå detta är att lägga till slumpmässigt brus till den samlade datan. I vägexemplet, du kan säga att antalet personer som föredrar att gå över gräset är 59 eller 61, snarare än exakt antal 60. Det felaktiga numret kan bevara Bobs integritet, men det kommer att ha väldigt liten inverkan på mönstret:cirka 60 % föredrar att ta en genväg.

    Ljudet är noggrant utformat. När Apple använde differentiell integritet i iOS 10, det lade till brus till individuella användaringångar. Det betyder att den kan spåra, till exempel, de mest använda emojierna, men varje enskild användares emoji-användning är maskerad.

    Cynthia Dwork, uppfinnaren av den differentiella integriteten, har föreslagit underbara matematiska bevis på hur mycket buller som är tillräckligt för att uppnå kravet på differentiell integritet.

    Vilka är dess praktiska tillämpningar?

    Differentiell integritet kan tillämpas på allt från rekommendationssystem till platsbaserade tjänster och sociala nätverk. Apple använder differentiell integritet för att samla in anonyma användningsinsikter från enheter som iPhones, iPads och Macs. Metoden är användarvänlig, och juridiskt klart.

    Differentiell integritet skulle också ge ett företag som Amazon tillgång till dina personliga shoppingpreferenser samtidigt som de döljer känslig information om din historiska inköpslista. Facebook skulle kunna använda det för att samla in beteendedata för riktad reklam, utan att bryta mot ett lands sekretesspolicy.

    Hur skulle det kunna användas i framtiden?

    Olika länder har olika sekretesspolicyer, och känsliga dokument måste för närvarande kontrolleras manuellt innan de flyttas från ett land till ett annat. Detta är tidskrävande och dyrt.

    Nyligen, ett team från Deakin University utvecklade differentiell integritetsteknologi för att automatisera sekretessprocesser inom molndelningsgemenskaper över länder.

    De föreslår att man använder matematiska formler för att modellera sekretesslagarna i varje land som kan översättas till "mellanprogram" (programvara) för att säkerställa att data överensstämmer. Att använda differentierad integritet på detta sätt kan skydda användarnas integritet och lösa en huvudvärk för datadelning för teknikföretag.

    Denna artikel publicerades ursprungligen på The Conversation. Läs originalartikeln.




    © Vetenskap https://sv.scienceaq.com