Detta ordmoln skildrar svar på sociala medier på frågan om vart rohingya-flyktingar ska ta vägen. Kredit:Carnegie Mellon University
Fyll i följande mening:Rohingya -flyktingar ska gå till ... -
A. Pakistan.
B. Bangladesh.
C. Helvete.
Det här är inte bra val, men alla är känslor som har uttryckts upprepade gånger på sociala medier. Rohingyas, som började fly från Myanamar 2017 för att undvika etnisk rensning, är dåligt rustade att försvara sig från dessa onlineattacker, men innovationer från Carnegie Mellon Universitys Language Technologies Institute (LTI) kan hjälpa till att motverka det hatretorik som riktas mot dem och andra röstlösa grupper.
LTI-forskarna har utvecklat ett system som utnyttjar artificiell intelligens för att snabbt analysera hundratusentals kommentarer på sociala medier och identifiera den fraktion som försvarar eller sympatiserar med röstbefriade minoriteter som rohingyasamhället. Mänskliga moderatorer för sociala medier, som omöjligt inte kunde sålla igenom så många kommentarer manuellt, skulle då ha möjlighet att markera detta "hjälptal" i kommentarsfält.
"Även om det finns massor av hatiskt innehåll, vi kan fortfarande hitta positiva kommentarer, " sa Ashiqur R. KhudaBukhsh, en postdoktorand forskare vid LTI som utförde forskningen med alumnen Shriphani Palakodety. Hitta och lyfta fram dessa positiva kommentarer, de föreslår, kan göra lika mycket för att göra internet säkrare, hälsosammare plats som att upptäcka och eliminera fientligt innehåll eller förbjuda de ansvariga trollen.
Lämnade åt sig själva, Rohingyas är i stort sett försvarslösa mot hatretorik på nätet. Många av dem har begränsade kunskaper i globala språk som engelska, och de har liten tillgång till internet. De flesta är för upptagna med att försöka hålla sig vid liv för att lägga mycket tid på att lägga upp sitt eget innehåll, sa KhudaBukhsh.
För att hitta relevant hjälptal, forskarna använde sin teknik för att söka efter mer än en kvarts miljon kommentarer från YouTube i vad de tror är den första AI-fokuserade analysen av Rohingyas flyktingkris. De kommer att presentera sina resultat på Association for the Advancement of Artificial Intelligence årliga konferens, 7-12 februari, i New York City.
Liknande, i en ännu opublicerad studie, de använde tekniken för att söka efter antikrigs "hopptal" bland nästan en miljon YouTube-kommentarer kring terrorattacken i Pulwama i Kashmir i februari 2019, vilket förbrände den långvariga konflikten mellan Indien och Pakistan om regionen.
Möjligheten att analysera så stora mängder text för innehåll och åsikter är möjlig på grund av de senaste stora förbättringarna av språkmodeller, sa Jaime Carbonell, LTI-direktör och medförfattare till studien. Dessa modeller lär sig från exempel så att de kan förutsäga vilka ord som sannolikt kommer att förekomma i en given sekvens och hjälpa maskiner att förstå vad talare och författare försöker säga.
Men CMU-forskarna utvecklade ytterligare en innovation som gjorde det möjligt att tillämpa dessa modeller på korta sociala medietexter i Sydasien, han lade till. Korta textbitar, ofta med stavnings- och grammatikfel, är svåra för maskiner att tolka. Det är ännu svårare i sydasiatiska länder, där människor kan prata flera språk och tenderar att "kodväxla, " som kombinerar bitar av olika språk och till och med olika skriftsystem i samma uttalande.
Befintliga maskininlärningsmetoder skapar representationer av ord, eller ordinbäddningar, så att alla ord med liknande betydelse representeras på samma sätt. Denna teknik gör det möjligt att beräkna närheten av ett ord till andra i en kommentar eller ett inlägg. För att utöka denna teknik till de utmanande texterna i Sydasien, CMU-teamet fick nya inbäddningar som avslöjade språkgrupperingar eller kluster. Denna språkidentifieringsteknik fungerade lika bra eller bättre än kommersiellt tillgängliga lösningar.
Denna innovation har blivit en möjliggörande teknologi för beräkningsanalyser av sociala medier i den regionen, Noterade Carbonell.
Urval av YouTube-kommentarerna visade att cirka 10 % av kommentarerna var positiva. När forskarna använde sin metod för att söka efter hjälptal i den större datamängden, resultaten var 88 % positiva, indikerar att metoden avsevärt skulle kunna minska den manuella ansträngning som krävs för att hitta dem, sa KhudaBukhsh.
"Inget land är för litet för att ta emot flyktingar, " sa ett sms, medan en annan argumenterade "alla länder borde ta ställning för dessa människor."
Men att upptäcka pro-rohingya-texter kan vara ett tveeggat svärd:vissa texter kan innehålla språk som kan betraktas som hatretorik mot deras påstådda förföljare, han lade till.
Antagonister till rohingya är "på riktigt som djur, inte som människor, så det är därför de folkmordar oskyldiga människor, " sa en sådan text. Även om metoden minskar manuella ansträngningar, kommentarer som denna indikerar det fortsatta behovet av mänskligt omdöme och av ytterligare forskning, kom forskarna fram till.