• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • En klass på alla språk

    Framsteg inom kommunikationsteknik har haft stor inverkan i alla slags branscher, men kanske ingen större än inom utbildning. Nu, alla från hela världen kan lyssna live på en Nobelpristagare -föreläsning eller tjäna krediter från de mest ansedda universiteten via internetåtkomst. Dock, den möjliga informationen att hämta från att titta och lyssna online går förlorad om publiken inte kan förstå föreläsarens språk. För att lösa det här problemet, forskare vid Nara Institute of Science and Technology (NAIST), Japan, presenterade en lösning med nytt maskininlärning vid det 240:e mötet i Special Interest Group of Natural Language Processing, Information Processing Society of Japan (IPSJ SIG-NL).

    Maskinöversättningssystem har gjort det anmärkningsvärt enkelt att be om vägbeskrivning i ett främmande land. Ibland, systemen kan göra roliga och oskyldiga fel, men totalt sett, de uppnår sammanhängande kommunikation, åtminstone för korta utbyten bara en mening eller två långa. Vid en presentation som kan sträcka sig över en timme, som en akademisk föreläsning, de är mycket mindre robusta.

    "NAIST har 20 procent utländska studenter och, medan antalet engelska klasser växer, alternativen dessa studenter har begränsas av deras japanska förmåga, "förklarar NAIST -professor Satoshi Nakamura, som ledde studien.

    Nakamuras forskargrupp förvärvade 46,5 timmars arkiverade föreläsningsvideor från NAIST med sina transkriberingar och engelska översättningar, och utvecklat ett djupt inlärningsbaserat system för att transkribera japanska föreläsningstal och därefter översätta det till engelska. När du tittar på videorna, användare ser undertexter på japanska och engelska som matchar föreläsarens tal.

    Man kan förvänta sig att den perfekta utgången skulle vara samtidiga översättningar som kan göras med live presentationer. Dock, levande översättningar begränsar handläggningstiden och därmed noggrannheten. "Eftersom vi lägger in videor med undertexter i arkiven, vi hittade bättre översättningar genom att skapa undertexter med längre behandlingstid, " han säger.

    Det arkiverade materialet som användes för utvärderingen bestod av föreläsningar från robotik, talbehandling och mjukvaruteknik. Intressant, ordfelfrekvensen i taligenkänning korrelerade till disfluency i föreläsarnas tal. En annan faktor från de olika felfrekvenserna var hur länge man talade utan paus. Korpusen som användes för utbildningen var fortfarande otillräcklig och bör utvecklas mer för ytterligare förbättringar.

    "Japan vill öka sina internationella studenter och NAIST har en stor möjlighet att vara ledande i denna strävan. Vårt projekt kommer inte bara att förbättra maskinöversättningen, det kommer också att ge ljusa sinnen till landet, " han fortsatte.


    © Vetenskap https://sv.scienceaq.com