• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  Science >> Vetenskap >  >> Andra
    Studie av ny metod som används för att bevara integriteten med amerikanska folkräkningsdata tyder på att noggrannheten har lidit
    Uppskattat rotmedelvärdefel (RMSE) för befolkningsantal för en ras/etnisk grupp, på varje geografisk nivå. RMSE kvantifierar den genomsnittliga felstorleken för en given geografi för en viss geografisk enhet. Trianglar för RMSE indikerar att det uppskattade medelkvadratfelet var negativt och därför satt till noll. Kredit:Science Advances (2024). DOI:10.1126/sciadv.adl2524

    Ett litet team av statsvetare, statistiker och datavetare från Harvard University, New York University och Yale University har funnit att den amerikanska folkräkningsavdelningen genom att byta till en ny metod för att bättre skydda integriteten har introducerat faktorer som minskar noggrannheten i vissa fall .



    I deras artikel publicerad i tidskriften Science Advances , beskriver gruppen hur de analyserade en fil som tillhandahållits av folkräkningstjänstemän för att mäta noggrannheten i allmänt tillgängliga folkräkningsdata och deras resultat.

    Inför den amerikanska folkräkningen 2020 valde tjänstemän vid U.S. Census Bureau att integriteten för de personer som ger svar på folkräkningen, att ändra metoden för att säkerställa datasäkerhet.

    Den gamla metoden kallades "byte". Det innebar att byta data från människor som bor i ett kvarter i en stad med människor i ett annat kvarter, och därigenom förhindra att människor identifieras utifrån deras data. Den nya metoden kallas "differentiell integritet" och den innebär att lägga till vad byrån beskriver som "brus" till varje data som samlas in.

    I denna nya ansträngning kunde forskargruppen inte hitta något exempel på en extern enhet som utförde forskning för att avgöra om den nya metoden verkligen gav mer integritet eller om den behandlade informationen var mer eller mindre korrekt än vad som var fallet när byte användes. Så de började en egen.

    Studien började med att forskargruppen bad Census Bureau att ge dem tillgång till det som kallas bullriga mätningsfilen (NMF) – den som användes för 2020 års folkräkning. Byrån avslog begäran, vilket ledde till att teamet stämde dem. Så småningom avbröts stämningsansökan när presidiet gick med på att ge teamet NMF i samband med den mycket mindre folkräkningen 2010 – en som genomfördes som ett sätt att testa den nya metoden, och som involverade både utbyte och differentiering.

    Forskarna analyserade sedan filen som ett sätt att studera effekten på noggrannheten av att byta till det nya systemet. Därmed fann de att de två systemen totalt sett gav ungefär lika noggrannhet i bred skala. Men de hittade också bevis på en minskning av noggrannheten på blocknivå av en typ som skulle kunna påverka minoriteter och multiraspopulationer negativt.

    Mer information: Christopher T. Kenny et al, Evaluating bias and noise induced by U.S. Census Bureau's privacy protection methods, Science Advances (2024). DOI:10.1126/sciadv.adl2524

    Journalinformation: Vetenskapens framsteg

    © 2024 Science X Network




    © Vetenskap https://sv.scienceaq.com