Kredit:CC0 Public Domain
Internetcensur från auktoritära regeringar förbjuder fri och öppen tillgång till information för miljontals människor runt om i världen. Försök att undvika sådan censur har förvandlats till ett ständigt eskalerande lopp för att hänga med i ständigt föränderliga, allt mer sofistikerad internetcensur. Censurregimer har haft fördelen i den rasen, eftersom forskare manuellt måste söka efter sätt att kringgå censur, en process som tar mycket tid.
Nytt arbete ledd av datavetare vid University of Maryland kan förändra balansen i censurloppet. Forskarna utvecklade ett verktyg som heter Geneva (förkortning av Genetic Evasion), som automatiskt lär sig hur man kringgår censur. Testad i Kina, Indien och Kazakstan, Genève hittade dussintals sätt att kringgå censur genom att utnyttja luckor i censurernas logik och hitta buggar som forskarna säger skulle ha varit praktiskt taget omöjligt för människor att hitta manuellt.
Forskarna kommer att presentera Genève under ett refereegranskat föredrag vid Association for Computing Machinerys 26:e konferens om dator- och kommunikationssäkerhet i London den 14 november, 2019.
"Med Genève, vi är, för första gången, en stor fördel i censurkapprustningen, sa Dave Levin, en biträdande professor i datavetenskap vid UMD och senior författare till tidningen. "Genève representerar det första steget mot en helt ny kapprustning där artificiell intelligenssystem av censorer och bedragare konkurrerar med varandra. I slutändan, Att vinna detta lopp innebär att ge yttrandefrihet och öppen kommunikation till miljontals användare runt om i världen som för närvarande inte har dem."
All information på internet bryts upp i datapaket av avsändarens dator och återmonteras av den mottagande datorn. En utbredd form av internetcensur som används av auktoritära regimer fungerar genom att övervaka de datapaket som skickas under en internetsökning. Censorn blockerar förfrågningar som antingen innehåller flaggade sökord (som "Tiananmen Square" i Kina) eller förbjudna domännamn (som "Wikipedia" i många länder).
När Genève körs på en dator som skickar webbförfrågningar via en censor, Genève ändrar hur data delas upp och skickas, så att censorn inte känner igen förbjudet innehåll eller inte kan censurera anslutningen.
Känd som en genetisk algoritm, Genève är en biologiskt inspirerad typ av artificiell intelligens som Levin och hans team utvecklat för att fungera i bakgrunden när en användare surfar på webben från en vanlig webbläsare. Liksom biologiska system, Genève bildar uppsättningar av instruktioner från genetiska byggstenar. Men istället för att använda DNA som byggstenar, Genève använder små bitar av kod. Individuellt, kodbitarna gör väldigt lite, men när de är sammansatta i instruktioner, de kan utföra sofistikerade flyktstrategier för att bryta upp, ordna eller skicka datapaket.
Genève utvecklar sin genetiska kod genom successiva försök (eller generationer). Med varje generation, Genève behåller de instruktioner som fungerar bäst för att undvika censur och sparkar ut resten. Genève muterar och korsar sina strategier genom att slumpmässigt ta bort instruktioner, lägga till nya instruktioner, eller kombinera framgångsrika instruktioner och testa strategin igen. Genom denna evolutionära process, Genève kan snabbt identifiera flera undandragningsstrategier.
"Detta inverterar helt hur forskare vanligtvis närmar sig problemet med censur, sa Levin, som har ett gemensamt möte vid University of Maryland Institute for Advanced Computer Studies. "Vanligtvis identifierar vi hur en censurstrategi fungerar och utarbetar sedan strategier för att undvika den. Men nu låter vi Genève ta reda på hur man kan undvika censuren, och sedan lär vi oss vilka censurstrategier som används genom att se hur Genève besegrade dem."
Teamet testade Genève i laboratoriet mot falska censorer och i den verkliga världen mot riktiga censorer. I labbet, forskarna utvecklade censorer som fungerade som de som är kända från tidigare forskning för att användas av autokratiska regimer. Inom några dagar, Genève identifierade praktiskt taget alla paketmanipuleringsstrategier som hade upptäckts av tidigare publicerat arbete.
För att visa att Genève arbetade i den verkliga världen mot oupptäckta censurstrategier, teamet körde Genève på en dator i Kina med en omodifierad webbläsare Google Chrome installerad. Genom att implementera strategier identifierade av Genève, användaren kunde surfa utan nyckelordscensur. Forskarna har också framgångsrikt undgått censur i Indien, som blockerar förbjudna webbadresser, och Kazakstan, som avlyssnade vissa sociala medier vid den tiden. I samtliga fall, Genève kringgick framgångsrikt censur.
"För närvarande, undvika-detekteringscykeln kräver omfattande manuell mätning, omvänd ingenjörskonst och kreativitet för att utveckla nya sätt att undvika censur, " sa Kevin Bock (B.S. '17, FRÖKEN. '18, datavetenskap), en datavetenskaplig Ph.D. student vid UMD och huvudförfattare till uppsatsen. "Med denna forskning, Genève representerar ett viktigt första steg i att automatisera censurflykt."
Forskarna planerar att släppa sin data och kod i hopp om att det ska ge öppen tillgång till information i länder där internet är begränsat. Teamet erkänner att det kan finnas många anledningar till varför individer som lever under autokratiska regimer kanske inte vill eller kan installera verktyget på sina datorer. Dock, de förblir oförskräckta. Forskarna undersöker möjligheten att distribuera Genève på datorn som tillhandahåller det blockerade innehållet (känd som servern) snarare än på datorn som söker efter blockerat innehåll (känd som klienten). Det skulle innebära att webbplatser som Wikipedia eller BBC kan vara tillgängliga för alla i länder som för närvarande blockerar dem, som Kina och Iran, utan att användarna behöver konfigurera något på sin dator.
"Om Geneva kan distribueras på serversidan och fungera så bra som det gör på klientsidan, då kan det potentiellt öppna upp kommunikation för miljontals människor, " sa Levin. "Det är en fantastisk möjlighet, och det är en riktning vi går efter. "