Tvåstegs modellarkitektur:Det första steget utför orddetektering baserat på Faster R-CNN. Det andra steget utför ordigenkänning med användning av en helt faltningsmodell med CTC-förlust. De två modellerna tränas var för sig. Kredit:Facebook
När ett meme är bortom fånigt och går över gränsen till direkt stötande, är det någon som bryr sig om butiken?
Säg hej till Rosetta, vilket är ett maskininlärningssystem som har konstruerats för att säga whoa. Facebook har byggt och distribuerat detta maskininlärningssystem. "Den extraherar text från mer än en miljard offentliga Facebook- och Instagram-bilder och videoramar (på en mängd olika språk), dagligen och i realtid, och matar in den i en textigenkänningsmodell som har tränats på klassificerare för att förstå sammanhanget för texten och bilden tillsammans."
Att känna igen hatretorik via automatisk teknik är aldrig lätt och det blir svårare med tiden. Rosetta kan lätta på att försöka se till att den inte glider ut oupptäckt. Rosetta är ett system som kan bestämma textens och bildens sammanhang tillsammans .
Vad betyder det? Förstå ord, förstå bilder...men nu till att förstå text i bilder?
Skickar till webbplatsen "Facebook Code", Viswanath Sivakumar, Albert Gordo, och Manohar Paluri, beskriv de utmaningar som lockade en lösning som Rosetta. Trots allt, annonsmaterial går längre än traditionella artiklar som är textcentrerade.
De sa att ett "betydligt antal av bilderna som delas på Facebook och Instagram innehåller text i olika former. Det kan vara överlagrat på en bild i ett meme, eller inlagd i ett foto av ett skyltfönster, vägmärke, eller restaurangmeny. Med hänsyn till den stora mängden foton som delas varje dag på Facebook och Instagram, antalet språk som stöds på vår globala plattform, och varianterna av texten, problemet med att förstå text i bilder är helt annorlunda än de som löses med traditionella system för optisk teckenigenkänning (OCR), som känner igen karaktärerna men inte förstår sammanhanget för den associerade bilden."
OK, AI, kan vi prata memes? Våra samtal har flera kryddor. Med Facebook, bilder med text läggs upp varje dag – inklusive memes. Rosetta är utformad (1) för att ge skärmläsare ett sätt att läsa vad som står på dem (2) för att se till att de inte innehåller hatretorik eller bryter mot webbplatsens innehållspolicy,
Snabbt företag påpekade att systemet mestadels har tillämpats på stillbilder, men Rosetta håller på att blöta om fötterna; detta kommer att röra sig djupare in. "Facebook planerar att i ökande grad anställa Rosetta för att extrahera betydelsen av text från video i alla dess applikationer, " även om tekniken inte är redo att hantera alla videor ännu.
Intressant, Snabbt företag Daniel Terdiman såg detta som ett vapen mot memer eftersom det har funnits ett behov av effektiva verktyg som tjänster kan lita på, att utrota memes som kan vara skadliga, i innehåll som annars kan flyga under radarn. "Vi älskar alla memes, och de flesta av oss har förmodligen hjälpt till att sprida dem – vidarebefordra det söta fotot med den ironiska texten till våra många vänner på Facebook, Twitter, och på andra ställen. Men ibland kan memes vara skadliga, sprider osanningar om människor eller organisationer."
Lätt och enkel, Rosetta-systemet kan göra ett bättre jobb än vad som tidigare varit möjligt "för att förstå skadlig eller falsk text som används i memes som sprids över Facebook och Instagram."
Mariella Moon in Engadget diskuterade hur det fungerar, och "det börjar med att upptäcka rektangulära områden i bilder som potentiellt innehåller text. Den använder sedan ett konvolutionellt neuralt nätverk för att känna igen och transkribera vad som skrivs i den regionen, även icke-engelska ord eller icke-latinska alfabet, " sa Moon. För att träna systemet, tillade hon, Facebook använde "en blandning av mänskliga och maskinkommenterade offentliga bilder."
Vad är Rosettas status just nu? Jacob Kastrenakes, Gränsen :"Rosetta sägs vara live nu, extrahera text från 1 miljard bilder och videorutor per dag på både Facebook och Instagram."
Vad kommer härnäst? Rosetta är inte perfekt; Facebook vill komma närmare perfektion, dock och har en att göra-lista. Moon sa att företaget planerar att fortsätta att öka antalet språk som det kan förstå och "att göra det bättre på att extrahera text från videoramar."
Är det någon som känner att det kan finnas några som kommer att skicka dåliga blickar till Rosetta när det blir mer känt? Kanske. Cohen Coberly in TechSpot skrev, "Rosetta kommer nästan säkert att vara ett kontroversiellt verktyg för vissa medlemmar av den meme-älskande allmänheten, men vi hoppas att tekniken kommer att visa sig smart nog att skilja mellan fånigt men ofarligt innehåll och verkligt stötande bilder."
Kastrenakes, Gränsen :"Med tanke på företagets välkända modereringsproblem, ett välfungerande system som automatiskt kan flagga potentiellt problematiska bilder skulle kunna vara en riktig hjälp."
© 2018 Tech Xplore