Framtida hörapparatanvändare kommer att kunna rikta in sitt lyssnande mer exakt tack vare ny dansk teknik. En forskare från Aalborgs universitet använder maskininlärning för att lära ett datorprogram hur man tar bort oönskat brus och förbättrar tal.
En av de största utmaningarna för personer med hörselnedsättning är att förstå tal i bullriga omgivningar. Problemet kallas cocktailparty -effekten eftersom situationer där många människor pratar samtidigt ofta gör det väldigt svårt att skilja vad som sägs av individen du pratar med.
Även om de flesta moderna hörapparater innehåller olika former av talförbättringsteknik, ingenjörer kämpar fortfarande med att utveckla ett system som gör en betydande förbättring.
Ph.D. student Mathew Kavalekalam från Audio Lab Analysis vid Aalborg University använder maskininlärning för att utveckla en algoritm som gör det möjligt för en dator att skilja mellan talade ord och bakgrundsbrus. Projektet görs i samarbete med hörapparatforskare från GN Advanced Science och stöds av Innovation Fund Denmark.
Datorn lyssnar och lär sig
"Hörapparaten i våra hjärnor utför vanligtvis en rad väldigt komplicerade beräkningar som gör att vi kan fokusera på en enda röst - även om det är många andra som pratar i bakgrunden, "förklarar Mathew Kavalekalam, Aalborgs universitet. "Men den förmågan är mycket svår att återskapa i en maskin."
Mathew Kavalekalam började med en digital modell som beskriver hur tal produceras i en människokropp, från lungorna via halsen och struphuvudet, mun och näshålor, tänder, mun, etc.
Han använde modellen för att beskriva vilken typ av signal som en dator ska "lyssna" efter när han försöker identifiera en talande röst. Han sa sedan till datorn att börja lyssna och lära.
Buller är inte bara buller
"Bakgrundsbuller varierar beroende på miljön, från gatan eller trafikbuller om du är utanför till bullret från människor som pratar i en pub eller en cafeteria, "Säger Mathew Kavalekalam." Det är en av många anledningar till att det är så knepigt att bygga en modell för talförbättring som filtrerar det tal du vill höra från babblandet du inte är intresserad av. "
Vid Aalborg universitet spelade Mathew Kavalekalam upp olika inspelningar av röster som pratade med datorn och gradvis lade till olika typer av bakgrundsljud på en ökande nivå.
Genom att tillämpa denna maskininlärning, datorprogramvaran utvecklade ett sätt att känna igen ljudmönstren och beräkna hur man kan förbättra det specifika ljudet av talande röster och inte bakgrundsbruset.
Femton procents förbättring
Resultatet av Kavalekalams arbete är en mjukvara som effektivt kan hjälpa personer med hörselnedsättning att bättre förstå tal. Det kan identifiera och förbättra talade ord även i mycket bullriga omgivningar.
Hittills har modellen testats på tio personer som har jämfört tal och bakgrundsljud med och utan användning av Kavalekalams algoritm.
Testpersonerna uppmanades att utföra enkla uppgifter med färg, siffror och bokstäver som beskrivs för dem i bullriga miljöer.
Resultaten indikerar att Kavalekalam mycket väl kan ha utvecklat en lovande lösning. Testpersonernas taluppfattning förbättrades med femton procent i mycket bullriga omgivningar.
Snabb signalbehandling
Dock, det återstår en del arbete innan Mathew Kavalekalams programvara hittar sin väg till nya hörapparater. Tekniken måste justeras och justeras innan den är praktiskt tillämpbar.
Algoritmen måste optimeras för att ta upp mindre processorkraft. Även om tekniken blir snabbare och mer kraftfull, det finns hårdvarubegränsningar i små, moderna hörapparater.
"När det gäller talförbättring, signalbehandling måste vara riktigt snabb. Om ljudet fördröjs i hörapparaten, det blir synkroniserat med munrörelserna och det kommer att göra dig ännu mer förvirrad, "förklarar Mathew Kavalekalam.