• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Varför människor kommer att slå maskiner i att känna igen tal under lång tid

    Kredit:Pathdoc/Shutterstock.cim

    Föreställ dig en värld där Siri alltid förstår dig, Google Translate fungerar perfekt, och de två skapar något som liknar en översättningskrets i Doctor Who-stil. Föreställ dig att kunna kommunicera fritt var du än går (inte behöva muttra på skolfranska till din parisiska servitör). Det är en attraktiv, men ändå avlägsen utsikt. En av flaskhalsarna för att föra denna verklighet framåt är variation i språket, särskilt talat språk. Tekniken klarar inte riktigt av det.

    Människor, å andra sidan, är fantastiskt bra på att hantera variationer i språket. Vi är så bra, faktiskt, att vi verkligen noterar när saker ibland går sönder. När jag besökte Nya Zeeland, Jag trodde ett tag att folk kallade mig "husdjur, "en Newcastle-liknande förälskelse. De var, faktiskt, säger bara mitt namn, Klappa. Mitt aha-ögonblick hände på ett kafé ("Platt vit för husdjur!" gav mig en paus).

    Den här historien illustrerar hur olika accenter av engelska har lite olika vokaler - ett välkänt faktum. Men låt oss försöka förstå vad som hände när jag misshörde Kiwi-uttalet av Pat som sällskapsdjur . Det finns ett visst utbud av ljud som vi associerar med vokaler, tycka om a eller e . Dessa intervall är inte absoluta. Snarare, deras gränser varierar, till exempel mellan olika accenter. När lyssnare misslyckas med att anpassa sig till detta, som jag gjorde i det här fallet, kartläggningen av ljud till mening kan förvrängas.

    En kan, mödosamt, lära olika accenter till ett taligenkänningssystem, men accentvariation är bara toppen av isberget. Vokalljud kan också variera beroende på vår ålder, kön, social klass, etnicitet, sexuell läggning, nivå av berusning, hur snabbt vi pratar, vem vi pratar med, oavsett om vi är i en bullrig miljö eller inte ... listan fortsätter bara, och igen.

    Sakens kärna/skurkar

    Tänk på att en nyligen genomförd studie som jag var involverad i visade att till och med att flytta hem (eller inte) kan påverka ens vokaler. Specifikt, det finns ett samband mellan hur talare av nordengelska uttalar vokalen i ord som krux , och hur många gånger de har flyttat under det senaste decenniet. Människor som inte har rört sig alls är mer benägna att uttala krux samma som skurkar , vilket är det traditionella nordengelska uttalet. Men de som har flyttat fyra gånger eller mer är mer benägna att ha olika vokaler i de två orden, likaså i södra England.

    Det finns, självklart, ingenting om handlingen att flytta som orsakar detta. Men att flytta hem flera gånger är korrelerat med andra livsstilsfaktorer, till exempel interagera med fler människor, inklusive människor med olika accenter, som kan påverka vårt sätt att tala.

    Andra variationskällor kan ha att göra med språkliga faktorer, som ordstruktur. Ett slående exempel kommer från ordpar som t.ex linjal , betyder "mätanordning" och linjal , betyder "ledare".

    Dessa två ord är ytligt identiska, men de skiljer sig åt på en djupare strukturell nivå. A linjal är någon som styr, precis som en sångare är någon som sjunger, så vi kan analysera dessa ord som bestående av två meningsfulla enheter. I kontrast, linjal vilket betyder att "mätanordning" inte kan dekomponeras ytterligare.

    Nivå av överlappning mellan "skurkar" och "crux" vokalkategorier, beroende på antalet bostadsflyttningar det senaste decenniet. Data från 143 talare från norra England.

    Det visar sig att de två betydelserna av linjal är förknippade med en annan vokal för många talare av södra brittisk engelska, och skillnaden mellan de två orden har ökat de senaste åren:den är större för yngre talare än för äldre talare. Så både dold språklig struktur och talarens ålder kan påverka hur vi uttalar vissa vokaler.

    Slutet är aldrig i sikte

    Detta illustrerar en annan viktig egenskap hos språkvariation:den förändras hela tiden. Språkforskare måste därför hela tiden se över sin förståelse av variation, vilket i sin tur kräver att man fortsätter att skaffa ny data, och uppdatering av analysen. Sättet vi gör detta inom lingvistik revolutioneras av ny teknik, framsteg inom instrumentell dataanalys, och inspelningsutrustningens allestädes närvarande (2018, 82 % av den vuxna befolkningen i Storbritannien ägde en inspelningsenhet, annars känd som en smartphone).

    Moderna språkliga projekt kan dra nytta av den tekniska utvecklingen på olika sätt. Till exempel, English Dialects App samlar in inspelningar på distans via smartphones, att bygga en stor och ständigt uppdaterande korpus av moderna engelska accenter. Den korpusen är källan till upptäckten om vokalen i krux på nordengelska, till exempel. Att ackumulera information från detta och många andra projekt gör att vi kan spåra variation med ökad täckning, och att bygga allt mer exakta modeller som förutsäger förverkligandet av individuella ljud.

    Kan denna nyförfinade språkliga förståelse också förbättra taligenkänningstekniken? Kanske, men för att förbättra, tekniken behöver veta mycket mer om dig.

    Den här artikeln är återpublicerad från The Conversation under en Creative Commons-licens. Läs originalartikeln.




    © Vetenskap https://sv.scienceaq.com