Den experimentella uppsättningen när försökspersonen (vänster) pratar med ERICA (höger) Kredit:Kyoto University / Kawahara lab
Vi har alla försökt prata med enheter, och i vissa fall pratar de tillbaka. Men, det är långt ifrån att ha en konversation med en riktig person. Nu, en forskargrupp från Kyoto University, Osaka University, och Advanced Telecommunications Research Institute, eller ATR, har avsevärt uppgraderat interaktionssystemet för konversations-android ERICA, ge henne ännu större dialogförmåga.
ERICA är en android skapad av Hiroshi Ishiguro från Osaka University och ATR, speciellt utformad för naturliga konversationer genom inkorporering av människoliknande ansiktsuttryck och gester. Forskargruppen demonstrerade uppdateringarna under ett symposium på National Museum of Emerging Science i Tokyo.
"När vi pratar med varandra, det är aldrig en enkel fram- och framåtutveckling av information, " säger Tatsuya Kawahara från Kyoto Universitys Graduate School of Informatics, och en expert på tal- och ljudbehandling. "Att lyssna är aktivt. Vi uttrycker samtycke genom att nicka eller säga 'uh-huh' för att behålla farten i konversationen. Detta kallas 'backchanneling', ' och är något vi ville implementera med ERICA."
Teamet fokuserade också på att utveckla ett system för "uppmärksamt lyssnande". Det är när en lyssnare ställer utförliga frågor, eller upprepar det sista ordet i talarens mening, möjliggör en mer engagerande dialog. Utplacera en serie avståndssensorer, ansiktsigenkänningskameror och mikrofoner, teamet började samla in data om parametrar som var nödvändiga för en flytande dialog mellan ERICA och en människa.
"Vi tittade på tre egenskaper när vi studerade backchanneling, " fortsätter Kawahara. "Dessa var:timing – när ett svar inträffar; lexikal form — vad som sägs; och prosodi, eller hur svaret sker."
Svar genererades genom maskininlärning med hjälp av en korpus för rådgivningsdialog, vilket resulterar i ett dramatiskt förbättrat dialogengagemang. Testa i fem minuters sessioner med en människa, ERICA visade betydligt mer dynamisk talförmåga, inklusive användning av backchanneling, partiella upprepningar, och utlåtandebedömningar.
"Att göra en människoliknande samtalsrobot är en stor utmaning, ", säger Kawahara. "Detta projekt avslöjar hur mycket komplexitet det är att lyssna, som vi kan betrakta som vardagliga. Vi närmar oss en dag då en robot kan klara ett Total Turing-test."