Upphovsman:CC0 Public Domain
Bevis tyder på att gränssnittet mellan människor och teknik bara kommer att bli mer centralt i det moderna livet.
För att människor ska kunna extrahera meningsfull information från massorna av data som samlas in av de "smarta" maskinerna som vi interagerar med - till exempel mobiltelefoner - måste datorer kunna bearbeta språk som människor. Grenen av artificiell intelligens som tillgodoser detta behov kallas naturligt språkbehandling.
En uppsats som heter "Algoritmer i den historiska framväxten av ordkänslor" - som visas online idag i Förfaranden från National Academy of Sciences ( PNAS ) - är den första som tittar på 1, 000 års engelsk utveckling och upptäck den typ av algoritmer som mänskliga sinnen har använt för att utvidga befintliga ord till nya meningar. Denna typ av "reverse engineering" av hur mänskligt språk har utvecklats kan ha konsekvenser för bearbetning av naturligt språk med maskiner.
"För att framgångsrikt kommunicera med människor, datorer måste kunna använda ord flexibelt men efter samma principer som vägleder språkbruk av människor, "förklarar Barbara Malt, Direktör för programmet Cognitive Science vid Lehigh University och en av projektets samarbetspartners.
Enligt Malt, ord samlar familjer med besläktade sinnen under historiens gång. Till exempel, ordet "ansikte" betydde ursprungligen den främre delen av ett huvud, men med tiden kom det också att betyda den främre delen av andra objekt, såsom klippans "ansikte", och ett känslomässigt tillstånd, som att sätta på ett modigt 'ansikte'.
"Detta jobb, "säger Malt, "syftade till att undersöka de kognitiva processer som skapar dessa sinnesfamiljer."
Teamet - inklusive huvudforskaren Yang Xu, en beräknande lingvist från University of Toronto och Mahesh Srinivasan, biträdande professor i psykologi vid University of California Berkeley, tillsammans med Berkeley-studenten Christian Ramiro-identifierade en algoritm som kallas "närmaste kedja" som den mekanism som bäst beskriver hur ordkänslor ackumuleras över tid.
I "närmaste grannkedjning" analyseras ingångspunkter som en hierarki av kluster. Forskarnas modell fångade kedjeprocessen som uppstår när framväxande idéer uttrycktes med ordet med det närmast besläktade befintliga sinnet. Denna kedjemodell passade bättre till det historiska mönstret för sinnesväxt än alternativa modeller.
"Det är en öppen fråga hur de algoritmer vi undersökte här kan tillämpas direkt för att förbättra maskinförståelsen för nytt språkbruk, "säger Xu.
Efter att ha utvecklat beräkningsalgoritmerna som förutspådde den historiska ordning i vilken ett ords sinnen har uppstått, laget testade dessa förutsägelser mot rekord av engelska under det senaste årtusendet med hjälp av Historical Thesaurus of English, en stor databas där vart och ett av ett ords många sinnen är markerat för datumet för språket.
Deras resultat tyder på att ordkänslor framträder på sätt som minimerar kognitiva kostnader, som är de kollektiva kostnaderna för att generera, tolkning och lärande av ordsinne. Med andra ord, nya ordsinne växer fram genom en effektiv mekanism som uttrycker nya idéer via en kompakt uppsättning ord.
"När nya idéer är kodade på engelska, det är mer troligt att de kodas genom att utöka betydelsen av ett befintligt ord än genom att skapa ett nytt ord, "säger Malt." En populär idé kan vara att när du har en ny idé måste du skapa ett nytt ord för det, men vi fann att denna strategi faktiskt är mindre vanlig. "
Förra året, samma team var det första som identifierade en uppsättning principer som styr en annan aspekt av språkutveckling:metaforisk kartläggning.
Under det senaste årtusendet, ordkänslor har till stor del utvecklats från bokstavliga domäner till metaforiska domäner - kallade metaforisk kartläggning. Ord som ursprungligen bara hade konkret eller yttre betydelse (som att "greppa" ett fysiskt föremål) har vuxit till att få mening i abstraktens och det inre (som att "greppa" en idé). Gruppen var den första som visade att denna utveckling har följt en kompakt uppsättning psykologiska och kognitiva principer och att rörelsen över världarna kan förutsägas.
Gruppens resultat publicerades i Cognitive Psychology i en artikel med titeln "Evolution of word meanings through metaforical mapping:Systematicity over the past millennium."
"Tillsammans, våra studier börjar visa att sätten på vilka ord har utvecklat nya betydelser inte är godtyckliga, men återspeglar istället grundläggande egenskaper hos hur vi tänker och kommunicerar med varandra, "förklarar Mahesh Srinivasan, Assistant Professor of Psychology and director of the Language and Cognitive Development laboratory at UC Berkeley