• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Andra
    Studie visar ansiktsdrag spår med intonation av ord

    I diagrammet ovan, den vänstra sidan visar positionen och rörelseriktningen för de fyra punkter som spårades i studien. Skuggorna nära ögonbryn/käke/näsa indikerar rörelse. Till höger är en visuell sammanfattning av de olika funktionerna extraherade från de fyra spårade nyckelpunkterna. POI=Intresseposition. Kredit:University of Kansas

    Även om de inte behövs för att göra de specifika ljuden, delar av mandarinkinesisktalandes ansikten – deras ögonbryn och läppar – efterliknar den stigande och sjunkande tonhöjden som skiljer ett ord som stavas exakt likadant från ett annat.

    Med andra ord, högtalarnas ögonbryn följer de ljud som deras hals gör.

    Detta är upptäckten av en ny studie skriven av Allard Jongman och Joan Sereno, University of Kansas professorer i lingvistik.

    De säger att det innebär behovet av att studera om dessa subtila ansiktsrörelser hjälper lyssnare att uppfatta vad högtalarna försöker förmedla.

    Tillsammans med kanadensiska universitetskollegor Saurabh Garg, Ghassan Hamarneh och Yue Wang, Jongman och Sereno skrev "Datorsynsanalys avslöjar ansiktsrörelser gjorda under mandarintonproduktion i linje med tonhöjdsbanor" i oktoberupplagan av tidskriften Talkommunikation .

    De säger att det är första gången dessa ansiktsrörelsers koppling till röstton har identifierats och kvantifierats.

    I en intervju nyligen, Jongman gav exemplet med det kinesiska ordet som fonetiskt skulle stavas "ma" på engelska. Som med många, om inte de flesta, Mandarin ord, det kan uttalas på ett av fyra sätt:nivå, stigande, doppa eller falla. Beroende, sedan, vid intonation, ordet kan betyda "mamma, " "hampa, " "häst" eller "skälla."

    "Du måste få det här rätt, " sa Jongman. "Annars, du kallar din mamma för en häst."

    "Det finns många språk som har dessa typer av tonhöjd som är associerade med olika ord, sa Sereno.

    "Majoriteten av talare i världen är tonspråkiga talare, ", sa Jongman. "Och allt kommer från variationer i frekvensen av röstbandsvibrationer."

    Pekar på hans hals, Jongman sa, "På hög tonhöjd, stämbanden här nere vibrerar i en väldigt snabb takt. Och när du har en låg tonhöjd, de vibrerar mycket långsammare. Så allt kommer från handlingen här nere."

    "Tekniskt, "Sereno sa, pekar på hennes ansikte, "det borde inte finnas något här uppe som skiljer "ma" med en hög tonhöjd mot "ma" med en fallande tonhöjd."

    Och ändå, deras studie fann, det finns. Människors ansiktsstrukturer efterliknar de stigande/fallande intonationerna de applicerar på sina ord.

    "Några av dessa samband mellan ansiktsrörelser och intonation eller tonhöjd hade provisoriskt fastställts, " sa Jongman. "Vi gick ett steg längre och sa, "OK, låt oss systematiskt titta på det här."

    Forskarna spelade in de kinesisktalandes ansikten när de talade, utsatte sedan filerna för datoranalys för att fastställa förhållandet mellan intonation och ansiktsrörelse. Jongman sa att det är en stor förbättring jämfört med tidigare metoder.

    "Förr, " han sa, "Folk har använt det som kallas opto-track-analys. Man limmar ett par ljusavgivande sensorer i ansiktet, och sedan spårar du rörelsen hos dessa sensorer. Och ibland limmar man till och med saker på läpparna. Så du sitter där med dessa sensorer, och du ombeds att tala. Jag menar, hur naturligt är det? Det begränsar vad folk skulle göra under normala omständigheter. Nummer två, du måste ha en förutfattad uppfattning om vad de viktiga regionerna i ansiktet kommer att bli, eftersom du inte kan ta en avläsning av något som du inte satt en sensor på.

    "Det är en stor fördel med vårt tillvägagångssätt. Vi har bestämt oss för dessa par funktioner nu. Men om någon annan grupp senare upptäcker att din örsnibb verkligen är viktig, vi kan gå tillbaka till våra inspelningar och analysera det."

    Nu när de har bevisat att mandarintalandes ansikten spåras med deras intonation, Jongman och Sereno sa att nästa steg kommer att vara att avgöra i vilken utsträckning dessa visuella signaler hjälper lyssnaren – deras "språkliga betydelse".

    "Vi kommer att datorgenerera ett ansikte och sedan manipulera de funktioner som vi just hittat och se om det gör någon skillnad, " sa Jongman. "Reagerar lyssnarna på det?"

    Precis som personer med hörselnedsättning kan lära sig att läsa läppar, människor kanske kan dra nytta av de mer subtila ansiktssignalerna, den nya studien har funnit.

    "Om du är hörselskadad, och vi kan kanske överdriva några av dessa ledtrådar lite eller lära folk att överdriva dem, eller även i språkinlärning gör det, som kan hjälpa mycket, " sa Jongman.

    Sereno sa att hon kan föreställa sig ett scenario där en språkinlärare får hjälp av att titta på infödda personers ansiktssignaler.

    "Visuell manipulation kan hjälpa till att identifiera det, "Sade hon. "Så när de hamnar i en naturlig situation, när det kanske finns mindre överdrift av dessa signaler, de kan fortfarande identifiera dem mycket bättre."


    © Vetenskap https://sv.scienceaq.com