• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Andra
    Maskinöversättning kan göra vetenskap endast tillgänglig för alla

    Maskininlärning med artificiell intelligens har förbättrat datoröversättningen under det senaste decenniet, men vetenskapliga artiklar som använder specialiserad jargong är fortfarande en utmaning för maskinöversättning. Ändå bör forskare prioritera att översätta artiklar till flera språk för att ge ett rättvist landskap för blivande forskare över hela världen, hävdar UC Berkeley-forskare. Kredit:Valeria Ramírez-Castañeda, UC Berkeley

    Medan han fortfarande gick på gymnasiet arbetade Xinyi Liu en kort stund i ett labb vid Beihang University i Peking och blev förvånad över att se kinesiska forskare rutinmässigt använda Google Översätt för att generera det första engelska utkastet till vetenskapliga artiklar. Översättning är ett måste om forskare vill skicka in till högprofilerade tidskrifter, som nästan alla är på engelska.

    "Det var normalt för postdoktorer att bara använda Google Översätt för att först översätta allt och sedan för att modifiera och finslipa det. Men efter den första översättningen var hela uppsatsen meningslös", säger Liu, en stigande junior vid University of California , Berkeley, som har huvudämne i molekylär- och cellbiologi. "Bokstavligen, alla ord, alla termer höll ihop helt slumpmässigt."

    Det måste finnas ett bättre sätt, tänkte hon.

    Så förra året, när hon såg ett nytt seminarium undervisas av Rebecca Tarvin om att bryta språkbarriärer inom vetenskap, anmälde hon sig.

    Den klassen, som kommer att undervisas vid UC Berkeley för tredje gången våren 2023, var en provballong för Tarvin, en biträdande professor i integrativ biologi. Med ett förnyat intresse för mångfald, jämlikhet och inkludering över hela campus, trodde hon och arbetsgrupper inom hennes institution att klassen kunde hjälpa UC Berkeley att ta itu med en långvarig fråga inom vetenskap:engelska, det dominerande vetenskapsspråket, är ett stort hinder för att vetenskapsmän som inte är engelska som modersmål.

    Det är inte bara utländska studenter och forskare som är i underläge när vetenskap framför allt kommuniceras på engelska. Det är också många amerikanskfödda studenter. Hösten 2020 var cirka 40 % av nybörjarstudenterna i UC Berkeley första generationens högskolestudenter, och inom University of California-systemet med 10 campus växte 39 % av första generationens studenter upp med ett annat språk än engelska som sitt första språk.

    "Många av våra studenter från Kalifornien växte upp med att översätta för sina föräldrar," sa Tarvin. "Översättning har varit en del av deras liv sedan de var mycket unga."

    För Tarvin var klassen – Breaking Language Barriers in Evolution and Ecology – en "möjlighet att både lära eleverna färdigheter i översättningskompetens och uppmuntra eleverna att vara aktivister i detta område av strukturella förändringar. Och faktiskt har jag sett en ett riktigt positivt mottagande av denna typ av aktivism från studenterna, eftersom de alla verkar vara överens om att det är väldigt viktigt att ta itu med språkbarriärer efter att ha gått kursen."

    Klassen ledde Tarvin och några doktorander vid UC Berkeley, tillsammans med medarbetare i Kanada, Israel och Ungern, för att skriva en vetenskaplig artikel som utvärderade nya maskinöversättningsverktyg som kan användas av människor över hela världen för att göra deras vetenskapliga artiklar tillgängliga för icke-engelsktalande . Tidningen dök upp online denna månad i tidskriften BioScience . Översättningar till spanska, franska, portugisiska och ungerska, medförfattarnas språk, finns också online.

    "Tanken här är att vi försöker ge människor verktygen och motivationen att översätta sin egen vetenskapliga forskning," sa Tarvin. "Vetenskapen behöver inte baseras på ett enda språk. Och det finns massor av ytterligare fördelar som kommer från att införliva flerspråkiga metoder i alla faser av vetenskapen. Till exempel kommer publicering på flera språk att gynna samhället på grund av bättre vetenskapskommunikation."

    "Språk kan vara en barriär, såväl som ett fantastiskt verktyg, för att föra människor samman", betonade Emma Steigerwald, som är första författare till uppsatsen och doktorand i UC Berkeley i miljövetenskap, policy och management. "Det är en barriär som vi kan övervinna med den här nya tekniken. Vi förklarar om tekniken och hur den kan implementeras och de saker som vi behöver vara medvetna om när vi använder tekniken, och alla underbara och positiva sätt som vetenskapskommunikation kan förvandlas genom att ta till denna nya teknik."

    Mot ett flerspråkigt vetenskapligt nätverk

    Tills nyligen var datoröversättning skämtsändan. Människor delade med sig av roliga exempel på felöversättningar, som ofta verkade nedvärdera andra språk än engelska och underförstått andra kulturer.

    Men maskininlärning, eller artificiell intelligens, har dramatiskt ökat översättningsnoggrannheten i den utsträckning som turister använder internettjänster som Google Translate för att kommunicera med människor i de länder de besöker.

    Men för text som innehåller mycket jargong – mycket vetenskaplig, men också från många andra akademiska områden – är Google Translate bedrövligt otillräckligt.

    "Översättningskvaliteten är inte för en tidskrift", säger Ixchel Gonzalez Ramirez, en av doktorandernas mentorer för kursen. "Många gånger måste folk betala för att få en professionell översättare att översätta sitt arbete, och det är väldigt dyrt."

    Den nya artikeln lyfter fram några av de många tjänsterna – de flesta gratis – som kan konvertera engelska vetenskapliga skrifter till andra språk. Förutom den välkända Google Translate-plattformen inkluderar dessa DeepL, som använder neurala nätverk och påstår sig vara många gånger mer exakt än konkurrenterna när de översätter engelska till kinesiska, japanska, romanska språk eller tyska, och vice versa; Baidu Translate, en tjänst från det kinesiska internetföretaget Baidu som till en början fokuserade på att översätta mellan engelska och kinesiska; Naver Pagago, en flerspråkig översättare skapad av ett företag i Sydkorea; och Yandex.Translate, som använder statistisk maskinöversättning och fokuserar mest på ryska och engelska.

    "Översättning blir mer och mer tillgänglig för alla människor. Oavsett om du är expert eller inte, och om du ens är tvåspråkig eller inte, är förmågan att översätta bara så snabbare av så många av de teknologier vi har tillgänglig idag." sa Steigerwald. "Och så hur kan vi integrera detta i vårt arbetsflöde som forskare, och hur förändrar detta förväntningarna som omger vetenskaplig kommunikation?"

    El aprendizaje automatizado que usa tecnologías de inteligencia artificiell ha mejorado la traducción en computador en la última década. Sin embargo, los artículos científicos que emplean terminologia especializada siguen siendo un reto para la traducción automática. Ingen obstante, la comunidad científica debería dar prioridad a la traducción de artículos en varios idiomas para ofrecer un panorama equitativo a los científicos y las científicas en formación de todo el mundo, afirman los investigadores de la UC Berkeley. Kredit:Valeria Ramírez-Castañeda, UC Berkeley

    Engelska är vetenskapens lingua franca

    Tarvins intresse för översättning uppstod från en av hennes doktorander, Valeria Ramírez Castañeda, som 2020 publicerade en artikel som beskrev kostnaderna för hennes colombianska doktorander som ville publicera eller interagera med kollegor i en värld dominerad av engelska.

    Som en evolutionär biolog intresserad av hur vissa djur kom att använda gift, bestämde Tarvin sig för att fokusera sitt nya seminarium på att översätta artiklar inom evolution och ekologi, även om studenter som registrerade sig så småningom planerade sina egna kurser. Hon sökte särskilt studenter, som Liu, och mentorer, som Gonzalez Ramirez, som är tvåspråkiga eller flerspråkiga.

    "Alla i klassen har haft någon form av familjerelaterad relation till språket," sa Tarvin.

    Tarvin bad också Mairi-Louise McLaughlin, professor i franska och lingvistik från UC Berkeley och expert på journalistisk och litterär översättning, att prata med klassen om hur proffs närmar sig översättning och hur översättning påverkar mening. Det ämnet fick resonans hos eleverna när de försökte sig på att översätta vetenskapliga sammanfattningar och ibland hela artiklar.

    Ruoming Cui, en stigande sophomore som gick kursen våren 2022, valde Baidu för att översätta vetenskapliga sammanfattningar. Hon upptäckte omedelbart att engelskas långa, komplexa meningar och användningen av flera ord för att beskriva ett begrepp verkade överflödiga när de tolkades till kinesiska.

    "Vi brukar inte göra det på kinesiska eftersom det gör varje mening extra lång, och det är väldigt tråkigt", sa hon.

    Liu tillade att utan betydande polering blir många engelska översättningar förvrängda, sa hon.

    "Jag hörde talesättet att även om ditt resultat är fantastiskt, om du skriver ett förvirrande papper på grund av översättningen, kommer folk att bli irriterade eftersom de inte kan förstå vad du gör," sa Liu. "Och det kommer i hög grad att påverka hur människor validerar forskningen eller om de ens kommer att läsa den. Jag tror att det är en stor barriär i den vetenskapliga världen."

    Steigerwald, Tarvin och deras medförfattare insåg också att att skriva vetenskapliga artiklar på enklare engelska – något som icke-vetenskapsmän har uppmuntrat under lång tid – gynnar både engelsktalande och icke-engelsktalande.

    "Om ditt första språk inte är engelska, och du bara försöker läsa den engelska versionen av tidningen, kommer det att kännas mycket mindre tvetydigt och mycket mer läsbart när författaren har använt klarspråk," sa Steigerwald. "Men också, mycket viktigt, när du går för att översätta den texten, kommer maskininlärningsverktygen att ha mycket lättare att översätta något som är skrivet på vanligt språk. Så, det här är en slags framtidssäkring av ditt skrivande, så att om någon vill översätta den till en miljon språk, kommer de att ha mycket lättare för det när det är skrivet på det sättet."

    Hinder kvarstår för utbredd översättning av vetenskapliga artiklar, inklusive var man gör dem tillgängliga och hur man hanterar upphovsrätt. De flesta tidskrifter accepterar inte ens artiklar som inte är på engelska, och få tillåter uttryckligen sampublicering av artiklar med översättning. Tarvin har upptäckt att få tidskrifter har någon policy om översättningar, och som ett resultat av allmänna upphovsrättsliga begränsningar tar många förlag ut orimliga avgifter för att lägga ut en översättning online efter publicering.

    "Det är ganska häpnadsväckande hur många tidskrifter som inte tillåter dig att fritt publicera översättningar efter publicering, och hur få som har plattformsstöd där du till och med bara kan ha ett sammandrag på ett andra eller tredje språk," sa Tarvin. "Jag tror att en stor barriär för detta är webbplattformarna, inte bara publicerings- och upphovsrättsreglerna, utan också plattformens funktionalitet."

    Med Breaking Barriers-seminariet och nu BioScience Tarvin och hennes kollegor hoppas kunna gradvis ändra normen inom vetenskapen till att som standard översätta uppsatser till andra språk, särskilt språket i landet där forskningen gjordes och medförfattarnas språk.

    Och ju fler översättningar där ute, desto mer material finns det för att träna maskinöversättningssystem för att göra ett bättre jobb, och gradvis höja kvaliteten på vetenskaplig översättning.

    "I mitt labb översätter vi mycket av vår forskning, och nu gör folk i Emmas labb också det", sa hon. "Jag tror att vår positiva inställning till detta och hur det kan göra skillnad för människor har påverkat en liten men växande grupp människor som börjar införliva översättning i sitt vetenskapliga arbetsflöde."

    Ytterligare medförfattare till BioScience uppsatsen inkluderar doktoranderna Valeria Ramírez-Castañeda och Débora Brandt från UC Berkeley; András Báldi från Institutet för ekologi och botanik vid centret för ekologisk forskning i Vácrátót, Ungern; postdoktor Julie Teresa Shapiro från Ben-Gurion University of the Negev i Beer Sheva, Israel; och Lynne Bowker, professor i översättning och tolkning vid University of Ottawa i Kanada. + Utforska vidare

    Facebook presenterar maskininlärningsöversättare för 100 språk




    © Vetenskap https://sv.scienceaq.com