• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Nya modeller för handskriftsigenkänning i latinska och arabiska skript online

    Arkitekturen för OnHS-LSTM. Upphovsman:Akouaydi et al.

    Forskare vid University of Sfax, i Tunisien, har nyligen utvecklat en ny metod för att känna igen handskrivna tecken och symboler i onlineskript. Deras teknik, presenterad i ett papper som för publicerats på arXiv, har redan uppnått enastående prestanda på texter skrivna i både det latinska och arabiska alfabetet.

    Under de senaste åren har forskare har skapat neurala nätverksbaserade arkitekturer som kan hantera en mängd olika uppgifter, inklusive bildklassificering, ansiktsigenkänning, naturlig språkbehandling (NLP), och många fler. System för handskriftsigenkänning är datorverktyg som är särskilt utformade för att känna igen karaktärer och andra handskrivna symboler på ett liknande sätt som människor.

    Under deras tidiga liv, faktiskt, människor utvecklar medfödd förmågan att förstå olika typer av handstil genom att identifiera specifika karaktärer både individuellt och när de grupperas tillsammans. Under det senaste decenniet eller så, många studier har försökt att replikera denna förmåga i datorsystem, eftersom detta i slutändan skulle möjliggöra mer avancerade och automatiska analyser av handskrivna texter.

    "Vårt papper hanterar problemet med onlinehandskriven igenkänning av skript baserat på ett extraktionssystem och ett djupgående system för sekvensklassificering, "skrev forskarna i sin artikel." Vi använde en existerande metod kombinerad med nya klassificerare för att uppnå ett flexibelt system. "

    I deras papper, forskarna vid University of Sfax presenterar två system baserade på djupa neurala nätverk:ett onlinehandskriftssegmenterings- och igenkänningssystem som använder ett långsiktigt korttidsminnesnätverk (OnHSR-LSTM) och ett onlinehandskriftsigenkänningssystem som består av ett konvolutionellt långt kort- termminnesnätverk (OnHR-covLSTM).

    Arkitekturen för (a) OnHR-convLSTM, (b) convLSTM -cellen. Upphovsman:Akouaydi et al.

    Deras första modell, kallad OnHSR-LSTM, är baserad på en teori som beskriver det mänskliga perceptuella systemet som ett sätt att omvandla språk från grafiska märken till symboliska representationer. Det fungerar genom att detektera vanliga egenskaper hos symboler eller tecken och sedan ordna dem enligt specifika perceptuella lagar, till exempel, baserat på närhet, likhet, etc.

    "Till sist, den [modellen] försöker bygga en representation av den handskrivna formen baserat på antagandet att formuppfattningen är identifiering av grundfunktioner som ordnas tills vi identifierar ett objekt, "förklarade forskarna i sin uppsats." Därför, representationen av handstil är en kombination av primitiva slag. Handskrift är en sekvens av grundkoder som grupperas för att definiera ett tecken eller en form. "

    Den första tekniken som forskarna föreslår delar i huvudsak ett handskrivet manus i individuella elliptiska drag med hjälp av en modell för handskriftsgenerering. Senare, dessa slag är indelade i primitiva koder, som används av den neurala arkitekturen för att känna igen ord i handskrivna manus online.

    Det andra systemet som forskarna föreslog, OnHR-konVLSTM, är en generativ modell som använder ett skripts onlinesignal som input och tränas i att förutsäga både tecken och ord. Denna andra teknik är särskilt användbar för sekvensinlärningsuppgifter (dvs. uppgifter som involverar bearbetning och klassificering av långa sekvenser av tecken och symboler).

    Forskarna utbildade och utvärderade båda sina system med hjälp av fem olika databaser som innehåller handskrivna skript i arabiska och latinska alfabet. Deras test gav anmärkningsvärda resultat, med båda systemen som uppnår erkännandefrekvenser på över 98 procent. Intressant, forskarna fann att prestanda för båda teknikerna är jämförbar med den som vanligtvis uppnås av människor i liknande uppgifter.

    "Vi planerar nu att bygga vidare på och testa våra föreslagna igenkänningssystem på en storskalig databas och andra skript, "skrev forskarna.

    © 2019 Science X Network




    © Vetenskap https://sv.scienceaq.com