Forskare genomför experiment på mobil robot. Kredit:HU Yanming
Människor visar fantastisk anpassningsförmåga när de hanterar komplexa uppgifter i det dagliga livet. Denna anpassningsförmåga är den direkta gestaltningen av individuell inlärningsförmåga, som gör det möjligt för människor att förbättra sin egen beteendeförmåga självständigt och stegvis.
Därför, om robotar kan ha denna förmåga, de kan automatiskt generera nya beteendemönster i enlighet med realtidsinsamlingen av data och fall. Denna förmåga visar uppenbar intelligens, som kallas beteendeintelligens.
Nyligen, forskaren vid Shenyang Institute of Automation vid den kinesiska vetenskapsakademin utvecklade en ny metod utvecklade en ny metod för att förbättra beteendeintelligensen hos robotar, relaterade resultat publicerades på IEEE-transaktioner på kognitiva och utvecklingssystem .
Forskaren föreslog ett nytt ramverk för inkrementell inlärningsmetod baserad på Q-Learning och adaptiv kärnlinjär (AKL) modell. Ramverket tillåter roboten att lära sig nya beteenden utan att glömma de tidigare. Enligt den nya metoden, robotbeteenden kan utvärderas med hjälp av autonomt lärande och imitationsinlärning, och modellstrukturen och parametrarna kan ändras i realtid med hjälp av en ny L2-norm kärnrekursiv minsta kvadraters (L2-KRLS) algoritm.
Förutom, de genomförde två experiment för att validera prestandan för den nya metoden. Resultaten visade att det föreslagna ramverket stegvis kan lära sig beteenden i olika miljöer. Lokalt girigt policybaserad Q-learning är snabbare än befintliga Q-learning-algoritmer. För närvarande, denna prestation har tillämpats i robotautonom navigering.