Webbplatser vill ha din (anonymiserade) sociala mediedata

Balanserar personlig integritet med detaljerade insikter. Upphovsman:Dawn Hudson/Shutterstock.com

Sociala medias webbplatsers svar på Facebook-Cambridge Analytica-skandalen och nya europeiska sekretessregler har gett användare mycket mer kontroll över vem som kan komma åt deras data, och för vilka ändamål. Till mig, som användare av sociala medier, Det här är positiva utvecklingar:Det är skrämmande att tänka på vad dessa plattformar kan göra med den mängd data som finns tillgänglig om mig. Men som forskare, ökade begränsningar för datadelning oroar mig.

Jag är bland de många forskare som är beroende av data från sociala medier för att få insikt i människors handlingar. I en brådska att skydda enskildas integritet, Jag oroar mig för att en oavsiktlig olycka kan vara kunskap om människans natur. Mitt senaste arbete, till exempel, analyserar känslor människor uttrycker på Twitter för att förklara varför börsen fluktuerar så mycket under en enda dag. Det finns applikationer långt bortom finansiering. Andra forskare har studerat tillfredsställelse för ryttare i kollektivtrafik, alarmsystemens funktion under naturkatastrofer och hur online -interaktioner påverkar människors önskan att leva en sund livsstil.

Detta ställer till ett dilemma - inte bara för mig personligen, men för samhället som helhet. De flesta människor vill inte att sociala medieplattformar ska dela eller sälja sin personliga information, om inte den enskilda användaren särskilt har godkänt det. Men som medlemmar i ett kollektivt samhälle, Det är användbart att förstå de sociala krafterna på jobbet som påverkar vardagen och långsiktiga trender. Innan de senaste kriserna Facebook och andra företag hade redan gjort det svårt för legitima forskare att använda sina uppgifter, bland annat genom att göra det svårare och dyrare att ladda ner och komma åt data för analys. Det förnyade offentliga trycket för integritet innebär att det sannolikt kommer att bli ännu hårdare.

Använda sociala medier i forskning

Det är definitivt oroväckande att tänka på möjligheten att människor eller företag kan analysera mina uppgifter och hitta sätt att påverka mig att fatta beslut som jag annars inte skulle kunna göra - eller som till och med strider mot mitt eget bästa. Jag behöver bara tänka på hur många gånger jag har sett en TV -annons för pizza under ett idrottsevenemang och beställt en pizza.

Det är poängen med marknadsföring, naturligtvis - men sociala medier är annorlunda eftersom informationen handlar om mig specifikt. Och att använda den informationen kan påverka mycket mer än vilken mat jag köper, som vem jag röstar på. Dock, som forskare inom finans, Jag inser också att samma data kan användas för att hjälpa oss att förstå kollektiva beteenden som annars är omöjliga att förklara.

Några av mina undersökningar, till exempel, utforskar kortsiktiga trender i aktiekurser. Finansiella experter har funnit att på lång sikt, ett företags aktiekurser drivs av företagets framtida värde. Men under en enda dag, aktiekurser kan variera mycket. Många finansforskare och finansanalytiker kommer att berätta att dessa rörelser är meningslösa buller, till synes slumpmässig information om företag som påverkar investerarnas uppfattning och får aktiekurser att variera ständigt.

Men genom att analysera data från sociala medier, Jag kan faktiskt förstå vad det är för buller, varifrån det kommer och vad det betyder. Till exempel, vad folk skriver på Twitter om den nya iPhone kommer att påverka Apples aktiekurs, ibland inom några minuter - men även under dagar. Effektens hastighet beror på vikten eller framträdandet hos personen som skickar tweeten, liksom hur snabbt andra - inklusive media - tar upp budskapet.

Resultat från min forskning kan hjälpa investerare att finjustera när och hur de kommer in på marknaden. Om, till exempel, användare av sociala medier tror att den senaste iPhone inte kommer att bli så bra som förväntat, investerare kan vänta på sin investering i Apple -aktier. Det kan frigöra dem att investera i något annat med bättre buzz, i hopp om högre avkastning.

Anonymisering av data

Det är sant - och oroande - att vissa förmodligen oetiska människor har försökt använda sociala medier för sin egen fördel. Men uppgifterna är inte det verkliga problemet, och att minska forskarnas tillgång till data är inte lösningen. Att göra det skulle också beröva samhället fördelarna med analys av sociala medier.

Lyckligtvis, det finns ett sätt att lösa detta dilemma. Anonymisering av data kan hålla människors individuella integritet intakt, samtidigt som forskare får tillgång till kollektiv data som kan ge viktiga insikter.

Det finns till och med en stark modell för hur man balanserar effektivt:U.S. Census Bureau. I årtionden, att myndigheten har samlat extremt personuppgifter från hushåll över hela landet:åldrar, anställningsstatus, inkomstnivåer, Personnummer och politiska tillhörigheter. Resultaten den publicerar är mycket rika, men inte heller spårbar för någon individ.

Det är ofta tekniskt möjligt att vända anonymitetsskydd på data, genom att använda flera bitar av anonymiserad information för att identifiera personen de alla relaterar till. Census Bureau vidtar åtgärder för att förhindra detta.

Till exempel, när medlemmar av folkräkningsuppgifterna, Census Bureau begränsar information som sannolikt kommer att identifiera specifika individer, som att rapportera finns det bara en person i ett samhälle med en särskilt hög eller låg inkomst.

För forskare är processen något annorlunda, men ger betydande skydd både i lag och i praktiken. Forskare måste klara Census Bureau's kontrollprocess för att se till att de är legitima, och måste genomgå utbildning om vad de kan och inte kan göra med data. Påföljderna för att bryta mot reglerna inkluderar att inte bara hindras från att använda folkräkningsdata i framtiden, men också civilrättsliga böter och till och med straffrättsligt åtal.

Även då, vad forskare får kommer utan namn eller personnummer. Istället, Census Bureau använder vad det kallar "skyddade identifieringsnycklar, "ett slumpmässigt tal som ersätter data som gör det möjligt för forskare att identifiera individer.

Varje persons uppgifter är märkta med sin egen identifieringsnyckel, tillåter forskare att länka information av olika slag. Till exempel, en forskare som vill spåra hur lång tid det tar för människor att slutföra en högskoleexamen kan följa individers utbildningsnivåer över tid, tack vare identifieringsnycklarna.

Sociala medieplattformar kan implementera en liknande anonymiseringsprocess istället för att öka hinder - och kostnad - för att komma åt deras data. De kan tilldela användarnas identifieringsnummer istället för att dela med sig av sina riktiga identiteter, och kan gå med på regeringens bestämmelser som definierar vem som kan få tillgång till vilka uppgifter, inklusive verkliga straff för brott mot reglerna. Då kunde forskare upptäcka insikterna från sociala medier, precis som de gör med folkräkningsdata, utan att hota människors integritet.

Denna artikel publicerades ursprungligen på The Conversation. Läs originalartikeln.