Ett nytt AI-verktyg som skapats för att hjälpa till att identifiera vissa typer av missbruk baserat på en hemlös ungdoms Facebook-inlägg kan ge hemlösa härbärgen viktig information att införliva i varje individs ärendehanteringsplan. Kredit:CC0 Public Domain
Det verkar som om julen kommer tidigt i år för samhällsvetare.
Det är för att, bara månader efter att Albert J. Weatherhead III University Professor Gary King skrev en akademisk artikel om ett system som skulle tillåta forskare att komma åt de enorma datamassor som Facebook och andra privata företag innehar, det kommer att bli verklighet.
Tillsammans med sin medarbetare Nathaniel Persily på Stanford, King skapade en organisation som heter Social Science One som kommer att leda arbetet med att identifiera data på Facebook, förbereda det för forskare, och finansiera många forskare för att analysera data.
Organisationen gör idag den första av vad King säger kommer att vara många datauppsättningar tillgängliga för forskning - en massiv mängd med mer än en halv biljon siffror som innehåller varje länk som Facebook -användare någonsin klickat på under det senaste året, inklusive typerna av människor som klickade, vad de klickade på, och indikatorer för huruvida länkar bedömdes vara avsiktligt falska nyheter.
"Som samhällsvetare, vårt mål är att förstå och lösa de största utmaningarna som påverkar det mänskliga samhället, " sa King. "Tjugo år sedan, nästan all data i världen för att hantera dessa utmaningar skapades av oss i akademin, av regeringar och ges till oss, eller av privata företag och säljs till oss, " sa han. "Men problemet är att även om vi har mer data än någonsin tidigare, vi har en mindre del av den data som världen skapar. Merparten av den data som skulle vara användbar för samhällsvetenskapen är nu inlåst i privata företag. Social Science One är en viktig mekanism för att låsa upp dessa data för samhällsvetare."
Och mängden data de kommer att ha tillgång till är nästan bortom att föreställa sig.
"Den data vi kommer att ge tillgång till är extraordinär - i kvantitet kan den konkurrera med den totala mängden data som för närvarande finns inom samhällsvetenskapen."
"Denna kommission har potential att öppna ett nytt kapitel i samhällsvetenskaplig forskning, och i det övergripande kunskapsinhämtningen, där de organisationer som har kritiskt viktig information om människor och institutioner, som plattformar för sociala medier, och professionella forskare kommer att kunna samarbeta mer effektivt för att ta itu med några av de svåraste problemen som vårt samhälle står inför, sa Matthew Baum, Marvin Kalb professor i global kommunikation vid Harvard Kennedy School, och ledamot av Social Science One-kommissionen.
Skisserat av King och Persily i ett arbetsdokument i april, ramverket som ligger till grund för Social Science One består av två delar.
Den första, han sa, är en kommission av framstående akademiker från hela världen som kommer att arbeta med Facebook-tjänstemän för att identifiera potentiella datamängder som de kommer att göra tillgängliga för forskare genom en process där studieförslag skickas in och peer review. När studieidéerna har godkänts, forskare får tillgång till uppgifterna samt anslag för att stödja deras arbete från sju välgörenhetsstiftelser. Stiftelserna sträcker sig över den ideologiska skalan men deras pengar slås samman, och alla beslut kommer att fattas av akademiker, och så ingen synvinkel kan dominera. Och de utomstående forskarna kommer att ha fullständig akademisk frihet utan att behöva ge Facebook förpubliceringsrättigheter.
"Nyckeldelen av processen är att kommissionen, som en pålitlig tredje part, kan titta på förslagen och besluta att vissa inte ska finansieras - även om det är vetenskapligt lämpligt - av skäl som inte är allmänt kända, som om de skulle beröra rättstvister som inte har offentliggjorts, " fortsatte han. "Och om Facebook avstår från detta avtal och inte gör data tillgänglig som Social Science One begär, vi är skyldiga att rapportera det till allmänheten. Så detta system är incitament kompatibelt för allmänheten, för företaget, och för det samhällsvetenskapliga samfundet. Vi tänker på detta som i huvudsak ett verk inom statsvetenskap, där vi kom fram till en grundlag som fungerar för alla partier."
Social Science One inkuberas vid Harvard's Institute for Quantitative Social Science, som King dirigerar. Över åren, IQSS har tagit på sig denna typ av verksamhet många gånger. Det har regelbundet inkuberat och skilt ut ideella forskargrupper och vinstdrivande företag, samt centra, program, och forskningsprojekt som nu finns på IQSS, någon annanstans på Harvard, och på andra institutioner.
Så spännande som det kan vara för forskare att ha tillgång till Facebooks datalagring, användningen – och missbruket – av Facebook-data har skapat rubriker världen över under de senaste månaderna, något King och kollegor har utvecklat rutiner för att undvika. De byggde in skyddsåtgärder i sina rutiner, den första är enkel - forskare kommer inte att få Facebook -data, de kommer bara att få tillgång till det.
"Ingen akademiker kommer att få uppgifter, som förut, " sa King. "Istället, vi kommer att göra dataåtkomst tillgänglig för akademiker så att individuell integritet alltid bevaras."
Dessutom, organisationen planerar att använda sig av ett matematiskt koncept som kallas "differentiell integritet, " för att säkerställa att den data som görs tillgänglig inte kan spåras tillbaka till enskilda användare. "Vi har några av de ledande experterna i världen som studerar detta koncept här på Harvard, inklusive Cynthia Dwork, Gordon McKay professor i datavetenskap vid Harvard John A. Paulson School of Engineering &Applied Sciences, och Salil Vadhan, Vicky Joseph professor i datavetenskap och tillämpad matematik, som båda är ledamöter av kommissionen, ", sa King. "Tanken är att du kan ta en datamängd och lägga till speciella typer av slumpmässigt brus för att göra det omöjligt att identifiera någon enskild person, men när du sammanställer det, det förändrar inte de övergripande mönstren du vill undersöka."
Men den absolut starkaste säkerhetsåtgärden, King sa:är relaterat till systemet som tillåter akademiker att komma åt data. "När akademiker kommer åt data, varje tecken de skriver kommer att loggas och granskas, " sa han. "Så om de skriver bokstaven 'k, ' vi vet att de skrev det brevet. Så det finns ingen möjlighet för dem att kopiera eller missbruka uppgifterna. Detta innebär att vi byter från en modell för individuellt ansvar, som gör att forskaren bryter mot reglerna som en enda punkt av misslyckande, till en av kollektivt ansvar, där ingen person kan kränka integriteten utan att alla vet och kan stoppa det."
I sista hand, King sa, Målet med Social Science One är att utveckla sätt för Facebook – och så småningom andra företag – att göra sina enorma datalager tillgängliga för forskare i hopp om att hitta lösningar på de sociala problem som fortsätter att plåga mänskligheten.
"Facebook har mycket informativ information om två miljarder människor, " sa King. "Det är ett otroligt privilegium, och med privilegiet följer ett stort ansvar. Det är bara vettigt att Facebook också använder en del av den informationen och makten för att hjälpa allmänheten och bidra till socialt bästa."
Det är en idé som inte är utan prejudikat, sa King.
Under decennierna, flera stora företag har byggt upp stora forskningsdivisioner – kanske mest anmärkningsvärt med skapandet av Bell Labs av AT&T och Microsoft Research på Microsoft – som gav forskare friheten att utforska ämnen så varierande som informationsteori till utveckling av lasrar och utveckling av transistorer.
I och med att den första datauppsättningen släpptes idag, King och kollegor hoppas kunna fortsätta den traditionen-men på ett sätt som är särskilt utformat för samhällsvetenskapliga företag.
"Detta är bara vår första datauppsättning - vi har ganska många andra som kommer efter detta, och vi har finansiering från sju generösa stiftelser, och så hoppas vi kunna börja få igång forskare snabbt, "King sa." Vi hoppas också kunna utvidga detta samarbete utöver Facebook och att samarbeta med andra företag också. "
"De upptäckter vi gör med dessa datamängder kommer inte att avbryta dessa företags verksamhet, men de kan hjälpa till att lösa några av de utmaningar som påverkar det mänskliga samhället, " sa King. "Och om det finns ett sätt att göra det, vem skulle inte vilja bidra till det uppdraget?"