Denna 23 mars, 2018, filfoto visar ett kuvert som innehåller ett folkräkningsbrev från 2018 som skickats till en amerikansk bosatt som en del av landets enda testkörning av folkräkningen 2020. Högsta domstolen kommer att avgöra om folkräkningen 2020 kan innehålla en fråga om medborgarskap som kan påverka fördelningen av platser i representanthuset och fördelningen av miljarder dollar i federala pengar.(AP Photo/Michelle R. Smith, Fil)
Ett internt team på Census Bureau fann att grundläggande personlig information som samlats in från mer än 100 miljoner amerikaner under antalet anställda 2010 kunde rekonstrueras från mörka data, men med många misstag, en topptjänsteman avslöjade på lördagen.
Åldern, kön, plats, ras och etnicitet för 138 miljoner människor var potentiellt sårbara. Än så länge, dock, endast interna hackningsteam har upptäckt sådana detaljer med möjlig risk, och inga utomstående grupper är kända för att ha tagit data som är avsedda att förbli privata i 72 år, chefsforskaren John Abowd berättade för en vetenskaplig konferens.
Census Bureau skrotar nu sin gamla dataskyddsteknik för en toppmodern metod som Abowd hävdade är mycket bättre än Googles eller Apples.
Vissa före detta byråchefer fruktar att det potentiella integritetsproblemet kommer att öka oron för att människor kommer att undvika att svara eller ljuga på undersökningen en gång vart 10 år på grund av Trump-administrationens försök att lägga till en mycket omdiskuterad fråga om medborgarskap.
Högsta domstolen meddelade på fredagen att den kommer att ta ställning till den föreslagna frågan, som har kritiserats för att vara politisk och inte ordentligt testad på området. Antalet folkräkningar är oerhört viktigt, hjälpa till med tilldelningen av platser i representanthuset och fördelning av miljarder dollar i federala pengar.
De 8 miljarder stycken av statistik i folkräkningsdata är tänkta att blandas ihop på ett sätt så att det som släpps offentligt för forskning inte kan identifiera individer på mer än sju decennier. 2010, Census Bureau gjorde detta genom att byta ut liknande hushållsinformation från en stad till en annan, enligt Duke University statistikprofessor Jerome Reiter.
I de interna testerna, Abowd sa, tjänstemän kunde matcha 45 procent av personerna som svarade på 2010 års folkräkning med information från offentliga och kommersiella datamängder som Facebook. Men fel i den här tekniken innebar att endast data för 52 miljoner människor skulle vara helt korrekta - lite mer än 1 av 6 av den amerikanska befolkningen.
Han sa att folkräkningen 2010 använde bästa möjliga integritetsskydd som finns tillgängligt, men hackare sedan dess har blivit skickligare på att rekonstruera data. För att motverka deras växande förmågor, byrån har helt förändrat systemet för 2020 och kommer att erbjuda "guldstandarden" för integritet oavsett medborgarskapsfrågans öde, sa Abowd.
Folk "vill veta att statistiska tabeller inte kommer att komma tillbaka och förfölja dem, " sa Abowd vid American Association for the Advancement of Sciences årsmöte. "Jag lovar det amerikanska folket att de kommer att ha den integritet de förtjänar."
Georgetown University provost Robert Groves, som ledde 2010 års folkräkning, sa att greven hade rätt integritet och att varje folkräkning förbättras. Han hyllade de nya stegen.
Tidigare byråchef Kenneth Prewitt, professor i politik vid Columbia University, sa den grundläggande informationen som ålder och etnicitet, även om det avslöjas offentligt, är inte lika stor sak som andra dataintrång.
"Det finns en utbredd integritetsoro där ute som är mycket relaterad till Facebook och Google och så vidare, ", sa Prewitt. "Jag är mycket mer orolig över det faktum att min iPhone följer mig runt varje dag."
I ett påstående, Apples Fred Sainz tog upp sådana integritetsproblem:"IPhone följer dig inte hela dagen lång – Apple har ingen aning om var du är och det bryr vi oss inte om. Och Apple säljer inte information till företag." Han noterade, dock, att konsumenter kan välja appar som vet var de befinner sig.
Abowd sa "2020 års folkräkning kommer att vara den säkraste och bäst skyddade någonsin. Och det här är inte så lätt som det låter."
Det nya systemet involverar komplexa matematiska algoritmer som injicerar "brus" i data, gör det svårare att få korrekt information och ger "en mycket stark garanti" för integritet, sa Duke University datavetenskap professor Ashwin Machanavajjhala.
Detta ökar integriteten samtidigt som träffsäkerheten sänks för forskare som använder statistiken. Se det som att en uppsättning rattar slås upp medan en andra slås ned samtidigt.
Beslutet om den officiella sekretess-/noggrannhetsinställningen för 2020 har inte bestämts. Abowd sa politiska tjänstemän, inte ingenjörer eller vetenskapsmän, kommer att ringa det samtalet.
Census Bureau provade detta system i en undersökning från 2018 med en extremt strikt integritetsinställning som, även om det inte är direkt jämförbart med Google eller Apple, är hundratals om inte tusentals gånger säkrare för integritet än vad som nu används på data från sökningar med Google Chrome eller Apples iPhone, sa Duke's Reiter.
Prewitt föreslog att allmänheten kanske inte förstår de extra ansträngningar som pågår för 2020 års räkning, men att de skulle bli skrämda av avslöjandet om integritetssårbarheten, gör folk mer ovilliga att följa nästa folkräkning.
Om förvaltningen lyckas lägga till medborgarskapsfrågan, "det kommer att bli ett enormt undvikande av det (folkräkningen) och visst selektivt missbruk av det, " sa Prewitt.
Oavsett om vissa undviker undersökningen på grund av det eller ljuger, inte heller är ett bra resultat, göra datan mindre användbar, sa Prewitt.
Groves sa att tekniska experter har allvarliga problem med medborgarskapsfrågan eftersom den inte har testats på fältet, som alla folkräkningsfrågor brukar vara. Han jämförde det med att släppa ut ett nytt läkemedel på marknaden innan de nödvändiga testerna.
"Mycket subtila formuleringar och positionsförändringar i en sak som folkräkningen kan ha en enorm inverkan långt utöver vad vi som människor kan förutsäga, " sa Groves
© 2019 The Associated Press. Alla rättigheter förbehållna.