• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Facebooks datalåsning är en katastrof för akademiska forskare

    Kredit:Shutterstock

    Facebook tillkännagav nyligen dramatiska begränsningar av dataåtkomst på sin app och webbplats. Företaget inramade låsningen som ett försök att skydda användarinformation, som svar på det offentliga uppropet efter Cambridge Analytica-skandalen.

    Men beslutet är i linje med växande restriktioner som åläggs forskare som studerar Facebook och dess fotodelningsapp Instagram, som också omedelbart började begränsa åtkomsten till sina uppgifter den 4 april.

    Faktiskt, flera begränsningar infördes i februari i år, innan Cambridge Analytica-fiaskot – där data påstås ha samlats in från 50 miljoner Facebook-profiler – bröt ut offentligt. Facebooks API, version 2.5, var planerad att gå i pension denna månad, genom att – bland annat – förhindra åtkomst till ID för användare som deltar i offentliga forum.

    Sociala nätverk erbjuder två huvudingångar för insamling av data:de fungerar som gränssnitt för användare och programvarugränssnitt utformade för konsumtion av datorprogram, känd som Application Programming Interfaces (API).

    Medan API:er är avsedda för programmerare som bygger appar som bidrar till det växande ekosystemet av tjänster som erbjuds av sociala nätverk, forskare har också utnyttjat dessa gränssnitt för att studera socialt beteende online.

    Med tanke på den enorma storleken på Facebooks användarbas (2,13 miljarder vid den senaste räkningen), extern granskning av innehållet på det sociala nätverket är extremt viktigt. På senare år har dock, forskare har kämpat i en uppförsbacke med företaget för att ge tillgång till data. Nu har dess senaste beslut gjort det praktiskt taget omöjligt att genomföra storskalig forskning på Facebook.

    Förändringarna gör att nedlagd programvara och bibliotek är dedikerade till akademisk forskning på Facebook, inklusive netvizz, NodeXL, SocialMediaLab, fb_scrape_public och Rfacebook, som alla förlitade sig på Facebooks API:er för att samla in data.

    Systematisk forskning om Facebook-innehåll är nu ohållbar, att göra det som redan var oroväckande ogenomskinligt, silade in det sociala nätverket i en svart låda som utan tvekan är ännu mindre ansvarig för lagstiftare och allmänheten – som båda gynnades av akademiker som övervakade utvecklingen på sajten.

    Deen Freelon, utvecklaren av fb_scrape_public som analyserar stora, allmänt tillgängliga datauppsättningar på Facebook, berättade för oss via e-post att "beslutet att begränsa åtkomsten till Pages API kan allvarligt försämra innehållsbaserad Facebook-forskning framöver, beroende på hur villig Facebook är att godkänna åtkomst. Om den inte godkänner åtkomst för de flesta forskningsändamål, som kan skapa incitament för forskare att skrapa Facebook direkt, som bryter mot dess användarvillkor." Dataskrapning eller -insamling är en metod genom vilken ett datorprogram extraherar information från webbsidor.

    Bernhard Rieder, en docent vid universitetet i Amsterdam som utvecklade netvizz – ett verktyg som extraherar data från Facebook för forskningsändamål – tror att flytten var en konsekvens av nivån av obegränsad tillgång som gavs till vem som helst fram till 2015 och att "det finns en verklig möjlighet att dessa tjänster kommer i allt högre grad att bli outgrundliga och oobserverbara".

    Fram till för tre år sedan, Facebook tillät tredjepartsappar att ha tillgång till data om appanvändares vänner. Det var denna funktion som användes av Aleksandr Kogan, en forskare vid University of Cambridge.

    Kogan – genom sin Global Science Research-startup, som var skild från hans akademiska arbete – påstås ha samlat in profilinformation från 270, 000 Facebook-användare och tiotals miljoner av deras vänner använder en personlighetstestapp som heter "thisisyourdigitallife". Det påstås att Cambridge Analytica använde dessa uppgifter i ett försök att rikta in sig på politiska kampanjer, inklusive det amerikanska presidentvalet 2016.

    Marc Smith, som ledde Microsoft-teamet som skapade NodeXL, som analyserar sociala nätverksdata, berättade att det fanns en möjlighet att ompröva de sociala nätverk som folk väljer att använda i ljuset av dataskandalen.

    Varför API:er är viktiga

    API:er tillåter forskare att hämta storskalig data och kurera databaser associerade med meningsfulla händelser. Utan dem, webbgränssnitt måste skrapas för att komma åt data, vilket är arbetskrävande och drastiskt begränsar mängden information som kan samlas in och bearbetas.

    Att låsa ut forskare från API:erna tvingar dem till mänskligt intensiva metoder för datainsamling som inte kan producera representativa exempel på verkliga händelser, som sociala rörelser, val och desinformationskampanjer.

    Twitter driver tre väldokumenterade, offentliga API:er utöver dess premium- och företagserbjudanden. Twitters relativa tillgänglighet leder till att den är kraftigt överrepresenterad i forskning om sociala medier. Men offentliga och öppna API:er är ett undantag i ekosystemet för sociala medier. Facebooks Public Feed API, till exempel, är begränsad till en begränsad uppsättning medieutgivare.

    Datalåsning

    Facebooks API-låsning kommer att vidga klyftan mellan industriforskare som anställs av sociala nätverk och forskare som arbetar utanför företag. Det är en klyfta som karakteriseras som klyftan mellan "big data rich forskare", som har tillgång till proprietär data och kanske bara arbetar i företagets intressen de är knutna till, och "big data poor" eller det breda universum av akademiska forskare.

    Facebooks beslut utökar dramatiskt denna pool av "big data poor". It limits research to projects sponsored by the network and potentially jeopardises research that is critical of Facebook.

    Shortly after the decision to drastically limit API access, Facebook vowed to help researchers gain access to social media data of public interest, starting with elections. The announcement was met with a mix of celebration and subdued support from researchers.

    Luca Rossi, who is associate professor at the IT University of Copenhagen, cautioned that the "data sharing model proposed by Facebook is deeply problematic and it will probably reinforce existing differences in terms of data access". The restriction is likely to continue the trend of researchers doing research they are able to as opposed to research they deem important.




    The impact on data science education is also considerable. If researchers are unable to access data from social networks, they will be unable to train students in data science, social science, computer sciences and digital humanities on methods of data collection and analysis that are rigorous, critical and ethical.

    Facebook's decision to render the API useless for meaningful research is a regrettable departure for collaboration between the social network giant and academics and it's already having an impact.

    The Events API, which researchers relied on to retrieve information about public events such as demonstrations, no longer permits access to users or posts on the event wall.

    Facebook's Groups API and Pages API were the endpoints researchers queried to study public discussions on Facebook, but the recent policy shift seals off those online conversations by restricting access to posts, comments or members participating in a public page or group.

    The changes made to Instagram's API are even more radical, with Facebook deciding to deprecate the API – a technical term for killing data access altogether.

    Nasty side effect

    Facebook's decision to restrict researchers is ironic because academics have long discussed the problems that led to the Cambridge Analytica scandal. Rieder wrote about the risks of Facebook API's wide open data door back in 2013.

    He cautioned against how much data a third-party app could get from Facebook. Facebook, dock, ignored those concerns until 2015, when management and policies regulating the sharing of Facebook data took a sharp turn and became increasingly more restrictive for researchers.

    Sedan dess, Facebook has become increasingly more cautious about external scrutiny. In the wake of the Cambridge Analytica scandal, Facebook CEO Mark Zuckerberg told Wired that the feedback it received was that "having the data locked down is more important to people than having different kinds of experiences".

    The public uproar clearly underscores how users' data was poorly handled, but a lockdown is hardly the solution to a problem rooted in the weaponisation of social networks, where people use Facebook, Twitter and so on to spread disinformation.

    The Cambridge Analytica scandal has created a worrying side effect:restricting access to data is likely to facilitate further weaponisation, by turning Facebook into a de facto black box that is largely unaccountable to external oversight.

    Denna artikel publicerades ursprungligen på The Conversation. Läs originalartikeln.




    © Vetenskap https://sv.scienceaq.com