Vad kännetecknar det sätt du säger, "Hej, "(eller något annat för den delen) som gör dig igenkännlig via telefon? Trots den ökande mängden litteratur om personlig röstkvalitet, väldigt lite är faktiskt känt om hur man karakteriserar ljudet från en enskild högtalare.
Två forskare från UCLA i Los Angeles, Kalifornien, Patricia Keating och Jody Kreiman, går samman (som de har gjort många gånger tidigare) för att tillämpa akustikverktyg för sin lingvistiska forskning, undersöker denna fråga. Keating och Kreiman kommer att presentera preliminära resultat av sin forskning vid det 172:e mötet i Acoustical Society of America och det femte gemensamma mötet med Acoustical Society of Japan, hölls 28 nov-dec. 2, 2016, i Honolulu, Hawaii.
Väsentligen, Keating och Kreimen vill ta reda på hur man mäter hur människor låter. "Det finns inget sätt att kvantifiera vad det betyder, "Sa Kreiman." När du ändrar något fysiskt, kan du förutse hur det kommer att låta? "
En enskild persons röst kan variera över tiden på grund av deras känslomässiga tillstånd, hälsa, konversationens kontext, eller en mängd andra faktorer som gör det svårt att kvantifiera denna mätning.
En stor mängd bevis från fonetik, kognitiv psykologi och neuropsykologi indikerar att lyssnare organiserar all denna intra-talker-variation i en prototyp för varje pratare-en "genomsnittlig" representation-och en uppsättning avvikelser från den prototypen. Även en enda stavelse kan bära tillräckligt med information för att skilja en röst från en annan, men det är ännu inte klart vad som specifikt är de viktigaste identifieringsegenskaperna inom en sådan prototyp, eller hur mycket varje egenskap måste variera innan rösten blir oigenkännlig.
"Röstkvaliteten kommer att vandra, "Sa Keating." Vi tittar på den punkt när du slutar låta som dig själv och börjar låta som någon annan. "
Keating och Kreiman analyserade digitalt inspelningar från femtio kvinnor, alla modersmål i engelska, som läste fem meningar två gånger på tre olika dagar. Denna analys tittade på flera akustiska parametrar för vokalen och konsonantljuden som utgör de lästa meningarna, såsom grundfrekvens, intensiteten hos harmoniska frekvenser i förhållande till varandra, och hur de jämför sig med de underliggande ljudnivåerna i rösten.
Dessa meningar gav varje egenskap ett kvantitativt genomsnitt och intervall, vars samling bildade en potentiell identifierande röstprofil av olika slag. Genom att jämföra alla högtalare med denna uppsättning egenskaper - en viss persons röstprofil - med hjälp av en slumpmässig uppsättning av deras exempelmeningar, den skulle kunna testas för noggrannhet för att skilja rätt högtalare och jämföras med hur väl andra uppsättningar av egenskaper fungerar för att särskilja en viss röst.
Detta arbete utökar tidigare arbete de två har framgångsrikt slutfört med ett urval av bara tre högtalare. Den större urvalsstorleken ger mer insikt för att förstå vilka egenskaper, och med vilken marginal, gör en igenkännbar röst oigenkännlig. Det är därför uppsättningen samplingar bestod av liknande högtalare, alla kvinnliga och modersmål engelska.
"Vem ska vara förvirrande och under vilka omständigheter?" Frågade Kreiman. "Hur mycket av en akustisk förändring är märkbar?" Blickar framåt, att svara på dessa frågor kan hjälpa till att skapa förutsägelser om förvirring i sammanhanget för båda mänskliga lyssnare, som tenderar att kunna känna igen igen på några sekunder, och datoralgoritmer, som vanligtvis kräver prover närmare en minuts längd.