En ny studie utforskar humor i ordinbäddningar

Representation av de kluster som identifierats av forskarna. Kredit:Gultchin et al.

Framsteg inom AI har möjliggjort utveckling av verktyg som kan förstå olika språk och kommunicera med människor. Dock, det finns fortfarande aspekter av mänsklig kommunikation som AI -system kämpar med, varav en är humor.

Ett team av forskare vid University of Oxford, Microsoft Research och TRASH har nyligen genomfört en studie som undersöker humor i ordinbäddningar. Ordinbäddningar är ett populärt AI-verktyg som kan associera ord med euklidiska vektorer.

"Vi var intresserade av att studera hur datorer kan förstå humor, "Adam Kalai, Microsofts forskare som genomförde studien, berättade TechXplore. "Medan AI är ganska kraftfull och till och med kan översätta från ett språk till ett annat, AI har misslyckats med att förstå humor. Vi bestämde oss för att testa om AI kunde förstå humor på nivån av ett enskilt ord, eftersom många tycker att vissa ord som "nincompoop" är lite roliga."

I sin studie, Kalai och hans kollegor övervägde sex huvuddrag i ordhumor, hämta inspiration från befintliga teorier och akademiska diskussioner om humor. Dessa funktioner inkluderar:humoristiska ljud (oavsett betydelse), sammanställningar/oväntad inkongruens, sexuella konnotationer, skatologiska konnotationer, kränkande ord och vardagsord.

Forskarna undersökte i vilken utsträckning dessa funktioner korrelerar med humor och hur väl ett word2vec inbäddar förtränade på en korpus från Google News, kallas GNEWS, kunde fånga var och en av dessa. En dataset som användes i deras studie var Engelthaler-Hill (EH) dataset, som består av genomsnittliga humorbetyg för 4, 997 ord, som var och en bedömdes på en skala från ett till fem (av cirka 35 mänskliga bedömare).

För att bättre förstå skillnaderna i människors uppfattning om roliga ord, forskarna samlade också en mindre originaluppsättning med mycket humoristiska ord, rekrytera engelsktalande personer för att märka dessa ord via Amazons Mechanical Turk-plattform. De genomförde en serie studier av humorbetyg, be deltagarna att välja de ord som de tyckte var mer humoristiska, samt att kommentera ord med relevanta humorteorier för var och en.

Figur som beskriver förhållandet mellan funktioner som är relaterade till ordteorier i ordet inbäddning och deras respektive humorbetyg. Kredit:Gultchin et al.

"Vi bad flera personer att betygsätta vilka ord de tyckte var mest humoristiska bland engelska ord, " Kalai förklarade. "Vi utformade en studie där människor identifierade de ord de tyckte var roligast med minimal ansträngning (minst klick)."

Senare, forskarna undersökte hur egenskaperna hos humor som de ursprungligen hade identifierat korrelerade med humorbetygen i deras datauppsättning, för att bestämma effektiviteten av teoretiska konstruktioner för att fånga betyg som ges av människor. Dessutom, de testade förutsägbarheten för dessa betyg med hjälp av ordinbäddningar, undersöka i vilken utsträckning AI kunde förstå humor.

"Vi fann att AI kunde förstå varför människor tyckte att vissa ord var roligare än andra, och AI kunde till och med förstå skillnaderna mellan sinnen för humor, "Sa Kalai." AI förstår fortfarande inte humor i meningar eller längre texter, men vi hoppas att vårt arbete är en startpunkt."

Kalai och hans kollegor fann att ordinbäddningar effektivt fångade aspekter av ordhumor som betygsatts på EH-datauppsättningen, samt skillnader i humorbetyg från deras nya dataset. Deras resultat tyder vidare på att människors sinne för humor kan vara inbäddad med en handfull betyg och att de resulterande inbäddningarna kan användas för att förutsäga humorbetyg för tidigare oklassificerade ord.

"Våra slutsatser visar en intressant tillämpning av ordinbäddningar och banar väg för att utnyttja dem för att göra mer AI-humorarbete, som att generera eller förutsäga humoristiska ord som matchar individuella sinnen för humor, och sammantaget, "Limor Gultchin, en forskare vid University of Oxford involverad i studien, berättade TechXplore. "På samma gång, vi ger också ytterligare validering till intuitiva föreställningar om humor, och kunskap samlad inom andra områden, såsom psykologi eller filosofi."

Studien utförd av Kalai, Gultchin och deras kollegor visar att ordinbäddningar kan förbättra vår förståelse av humor på en mängd olika sätt. För det första, de fann att etablerade teorier om humor (t.ex. överlägsenhetsteorin, inkongruitetsteori, etc.) representeras i ordinbäddningar i varierande grad och kan därmed användas för att identifiera eller förutsäga humor, fångas av mänskliga betyg.

Tabell som visar skillnaderna mellan en mer "kvinnlig" humor än "manlig". Kredit:Gultchin et al.

Med hjälp av vektorrepresentationer av ord, forskarna kunde också definiera ett individuellt sinne för humor som en genomsnittlig vektor, med hjälp av dessa vektorer för att förutsäga olika människors sinnesinne (dvs. de humorbetyg de skulle ge vissa ord). Till sist, klustring av sinnen för humor tillät dem att identifiera kluster av humor, som "kvinnlig humor, ''manlig humor, ''äldre humor, ' etc.

Detta är ett viktigt fynd, eftersom det bekräftar tanken att olika grupper av människor har olika sinnen för humor. Till exempel, de observerade att sexuella ord (t.ex. 'vallmo') var roligare för män än för kvinnor, medan kvinnor reagerade mer på "roligt klingande" ord (t.ex. "gobbledegook").

"I en ålder av vanliga AI-system, såsom rekommendatorsystem eller automatiserade assistenter, humor skulle sannolikt visa sig vara viktig för att underlätta en smidigare, mer sömlös interaktion mellan användare och automatiserade system, "Gultchin sa." Vi hoppas att detta arbete kommer att hjälpa som ett bevis på konceptet som visar att befintliga NLP -verktyg redan kan hjälpa oss att uppnå det målet. "

Kalain, Gultchin och deras kollegor kommer att göra de nya datamängderna som används i deras studie offentligt tillgängliga, så att andra forskare kan använda dem i sina studier. De anser att en förbättring av AI-systemens förståelse av ordhumor kan öppna upp för flera intressanta möjligheter, till exempel leder till utveckling av verktyg för att hjälpa komiker eller förbättra interaktioner mellan maskiner och människor.

"Vi håller fortfarande på att se hur detta arbete kommer att accepteras, men det finns flera framtida riktningar, ", sa Gultchin. "Det skulle vara riktigt intressant att se om begreppen här verkligen skulle kunna användas i ett interaktivt system som producerar "roliga" modifieringar av meningar baserat på en individs sinne för humor, som representeras med hjälp av ordinbäddningar. En annan intressant riktning är att se om vi så småningom kan lära oss att förutsäga och generera fullständiga humoristiska meningar eller, med den senaste utvecklingen, fullständiga humoristiska stycken."

3D-tryckt verktyg skär igenom titan, vinner innovationspriset

Ny AI-metod överbryggar det slanka datagapet som kan hindra djupinlärning

Elektronik