• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Andra
    Utforska användningen av töjbara ord i sociala medier

    Skrattträdet. Detta stavningsträd för utsträckta versioner av ordet "ha" visar många av de olika sätten som dessa ord stavas när de sträcks ut. Trädets mönster representerar stavningen av orden, med det initiala "h" i roten, och följande bokstäver grenar åt höger för ett 'a' och vänster för ett 'h'. Tjockare banor representerar mer dominerande mönster, med många ord som stannar vid en intern nod efter några förgreningar. Några av de längre mönstren som når en terminalnod är märkta med stjärnor. Den infällda plotten visar hur frekventa olika sträckta versioner av 'ha' är baserat på hur länge de sträcks. Några punkter är kommenterade med exempel på sträckta versioner av den längden, men spetsen representerar alla sträckta versioner av den längden. Poäng för ett jämnt antal tecken tenderar att vara högre på grund av tendensen att perfekt alternera 'h' och 'a' som i 'hahaha...'. Kredit:Gray et al, 2020

    En undersökning av Twitter-meddelanden avslöjar nya insikter och verktyg för att studera hur människor använder sträckta ord, som "duuuuude, " "heyyyyy, " eller "nejåååå." Tyler Gray och kollegor vid University of Vermont i Burlington presenterar dessa resultat i tidskriften med öppen tillgång PLOS ETT den 27 maj, 2020.

    I tal och skrift, sträckta ord kan ändra betydelsen av ett ord. Till exempel, "suuuuure" kan antyda sarkasm, medan "yeeessss" kan tyda på spänning. Sträckta ord är sällsynta i formell skrift, men framväxten av sociala medier har öppnat nya möjligheter att studera dem.

    Gray och kollegor har nu genomfört den hittills mest omfattande studien av "töjbara" ord i sociala medier. De utvecklade en ny, mer noggrann strategi för att identifiera utsträckta ord i tweets och använde den för att analysera en slumpmässigt utvald datauppsättning av cirka 10 procent av alla tweets som genererades mellan september 2008 och december 2016 – totalt cirka 100 miljarder tweets.

    Forskarna identifierade tusentals "töjbara" ord i tweets, inklusive "ha" (t.ex. "hahaha" eller "haaahaha"), "häftigt" (t.ex. "awesssssommmmmeeeeee") och "mål) (t.ex. ggggooooaaaaallllll).

    De identifierade också två viktiga sätt att mäta egenskaperna hos töjbara ord:balans och stretch. Balans hänvisar till i vilken grad olika bokstäver tenderar att upprepas. Till exempel, "ha" har en hög grad av balans eftersom när den sträcks, "h" och "a" tenderar att upprepas ungefär lika mycket. "Mål" är mindre balanserat, med "o" upprepad mer än någon annan bokstav i ordet.

    Stretch hänvisar till hur länge ett ord tenderar att sträckas ut. Till exempel, korta ord eller ljud som "ha" har en hög grad av stretch eftersom människor ofta upprepar dem många gånger (t.ex. "hahahahahahahaha"). Under tiden, vanliga ord som "oändlighet" har lägre stretch, ofta med bara en bokstav upprepad:"oändligt ååå."

    För denna analys, forskarna utvecklade olika verktyg och metoder som skulle kunna användas i framtida forskning om töjbara ord, som undersökningar av felskrivningar och felstavningar. Verktygen kan också användas för att förbättra naturlig språkbehandling, sökmotorer, och spamfilter

    Författarna tillägger:"Vi kunde på ett omfattande sätt samla in och räkna utsträckta ord som 'gooooooaaaalll' och 'hahahaha', och kartlägga dem över de två dimensionerna av total stretchighet och balans mellan stretch, samtidigt som de utvecklar nya verktyg som också kommer att underlätta deras fortsatta språkstudier, och inom andra områden, som språkbehandling, utöka ordböcker, förbättra sökmotorer, analysera konstruktionen av sekvenser, och mer."


    © Vetenskap https://sv.scienceaq.com