Facebook-datainsamling – vad du behöver veta

Ett vax av Facebook-chefen Mark Zuckerberg. Kredit:Shutterstock

Facebook tjänar större delen av sina pengar på reklam, och – eftersom Cambridge Analytica-skandalen fortsätter att förfölja Mark Zuckerbergs företag – kräver användare att få veta hur deras data bråkas och skördas.

Men medan oron för Facebooks användares integritet har ökat, det har varit tydligt sedan Facebooks start att dess verksamhet bygger på omfattande övervakning av människor, vars data är produkten.

Vissa har framställt avslöjandena av Cambridge Analytica-skandalen – där data påstås samlats in från 50 miljoner Facebook-profiler – som en "existentiell kris". medan andra har lyft fram potentiella implikationer för akademisk forskning.

Kortfattat, Facebooks datainsamlingsmetoder har blivit föremål för plötslig och utbredd oro.

Vad är datainsamling?

Skörda data, som dess jordbruksnamn antyder, liknar insamling av grödor eftersom det innebär insamling och lagring med förväntan på framtida belöning.

Data kan samlas in på olika sätt, allt från enkel kopiera-och-klistra till mer komplicerad programmering. Den valda metoden är ofta begränsad av platsen som skördas. På enkla söknivåer, många webbplatser bekämpar automatisk skörd med Google CAPTCHAs och reCAPTCHAs, som hjälper webbplatser att skilja mellan människor och bots.

Om du någon gång har kopierat och klistrat in text från Facebook eller sparat en bild från Twitter, du har samlat in data från sociala medier. Åtgärden "skärmdumpning" är tillåten på de flesta webbplatser eftersom användare vanligtvis bara kan komma åt information som antingen är offentlig eller synlig för dem eftersom de har loggat in. det skulle vara omöjligt att helt utrota de enklaste datainsamlingsmetoderna, som att göra anteckningar och fotografera.

Facebook och andra sociala nätverk är mer angelägna om att begränsa automatisk datainsamling, på grund av krav på webbservrar och för att styra vem som har tillgång till vilken data (och varför). Personlig information och beteende på sociala medier har kommersiella, politiskt och forskningsmässigt värde.

Sociala nätverk bestämmer sina egna användningspolicyer, balansering av kommersiella intressen med tredje part och lagstadgade oro för användarnas integritet – ofta beskrivet i företagsdokument som att man jonglerar med optimering av "kundbeteende" och att följa "gemenskapsstandarder".

Hur samlas data in?

Application Programming Interfaces (API) används av Facebook, Twitter, Instagram och andra webbplatser för att begränsa blivande skördares åtkomst. API:er fungerar som en mjukvarumellanväg som gör att en forskare eller apputvecklares dator kan "prata" med ett socialt nätverk på ett kontrollerat sätt.

Läs mer:Hur Cambridge Analyticas Facebook-inriktningsmodell verkligen fungerade – enligt personen som byggde den

Ett av huvudvillkoren innebär begränsningar av hur insamlad data kan användas och delas, som kan förföljas aggressivt. 2010, datorprogrammeraren Pete Warden samlade in data från 210 miljoner offentliga Facebook-profiler för forskningsändamål. Men han misslyckades med att söka tillstånd från Facebook först, och därmed bryter mot dess användarvillkor. Han stod senare inför hotet om rättsliga åtgärder från Facebook och tvingades radera uppgifterna – i ett eko av den akademiske forskaren Aleksandr Kogans påstådda del i Cambridge Analytica-skandalen.

Kogans app, kallad "thisisyourdigitallife", utvecklades 2014 genom hans företag Global Science Research (GSR) – separat från hans universitetsarbete – var ett personlighetstest som 270, 000 användare inloggade, acceptera att den skulle ha tillgång till en del av deras personliga information och vissa av deras vänners data också. Det innebar också att dessa vänner inte hade samtyckt till att deras data användes på detta sätt.

Facebook uppdaterar rutinmässigt sitt API och 2014 bekräftade företaget att det skulle sluta tillåta tredjepartsappar att få tillgång till data om appanvändares vänner. Detta inaktiverade den datainsamlingsmetod som påstås ha använts av Kogan.

Det finns några olika sätt som utvecklare – som måste godkänna Facebooks policyer – kan samla in data med hjälp av företagets API och de antar alla åtminstone grundläggande datorprogrammeringskunskaper. Ett av de enklaste sätten att göra detta är att komma åt API:t med hjälp av en specialistprogramvara – Python och R har verktyg som är utformade speciellt för detta ändamål. I min forskning, Jag använder Rfacebook-paketet för att samla in Facebook-data.

En viktig skillnad mellan min app och andra är att jag inte interagerar med användare, eftersom min app inte är live. Min app är i huvudsak ett automatiserat sätt att kopiera och klistra in information från offentliga Facebook-grupper. Jag använder Facebooks API för att undersöka hur offentliga gruppsidor har använts för att protestera mot åtstramningar i Irland.

Eftersom jag samlar in offentlig data från offentliga sidor, Jag ber inte användare att logga in och det finns inget front-end-gränssnitt på Facebook, även om detta kan göras med hjälp av Facebooks API-verktygssatser för att utöka mängden data som kan nås. Det är en metod som väcker ett antal frågor om funktionalitet, användarinformation och åtkomstbehörigheter.

Facebooks API kan användas för att samla in all slags allmänt tillgänglig information, som några av The Conversation UKs senaste inlägg eller inlägg i offentliga grupper.

Men försök att gå bortom offentlig information för att samla in data från Facebook-användare som inte har loggat in på appen – som Zuckerberg, till exempel – returfel. Facebook "gilla" kan inte skördas eftersom Zuckerberg inte är en användare av min app och han inte har gett den tillstånd att komma åt hans data.

Under Facebooks senaste API-uppdateringar, appbehörigheter krävs för att samla all information utöver offentliga profilegenskaper. Detta innebär att användare måste logga in på en app och godkänna åtkomst till all annan information för att utvecklare ska kunna samla in data.

Legitimerad forskning hotad?

Medan reklamfyllda företag uppenbarligen har ett intresse av att "utnyttja" data, akademiker – de senaste veckorna – har uppmärksammat forskare som skördar Facebook-data. Praktiken har blivit relativt mainstream inom samhällsvetenskaplig forskning.

I vilken utsträckning framtida forskning kan begränsas av förändringar av Facebooks API är en angelägen sådan. Men det är värt att notera att när data har samlats in, Facebook – som lagligt kan förfölja personer som "bryter mot" dess användarvillkor för att försöka tvinga dem att radera data – har begränsad kontroll över var data som hamnar.

För forskare som oroar sig över hur Cambridge Analytica-skandalen kommer att påverka deras arbete, det är värt att hålla ett öga på vilka förändringar Facebook implementerar i sin nästa API-uppdatering. Det kan ge en bättre förståelse för vilken typ av forskning som kan tillåtas från användningen av insamlad Facebook-data – och vad som kan uteslutas permanent.

Denna artikel publicerades ursprungligen på The Conversation. Läs originalartikeln.

Vägen till en blomstrande australisk marknad för solvärmeenergi

Huspanelen säger att Facebooks Zuckerberg vittnar den 11 april

Elektronik

Nordkorea utforskar sanktionssäker energiteknik

Arms Cortex-A76-set för att leverera prestandahöjningar med bra batteritid

USGS och DOE släpper rikstäckande vindkraftskarta och databas

Vetenskap

Hur man fixar rörelsen för avyttring av fossila bränslen

Studie modellerar ny metod för att accelerera nanopartiklar

Datamodeller pekar på en potentiellt mångsidig metabolisk meny hos Enceladus