• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Tweaking-verktyg för att spåra tweets över tid

    Xiangliangs dynamiska beräkningsmodeller kan analysera tweets för att identifiera Twitter-användares intressen. Kredit:KAUST

    Dina inlägg på sociala medier avslöjar mycket om dig. KAUST-forskare har utvecklat en dynamisk beräkningsmodell som kan analysera tweets för att identifiera Twitter-användares intressen och spåra förändringar över tid. "Att förstå utvecklingen av användarnas intressen innebär att vi kan gruppera dem därefter och rekommendera vänner, Nyheter, evenemang och andra tjänster, säger Xiangliang Zhang som ledde forskningen vid KAUST.

    Att skapa datormodeller som kan identifiera en persons växande intressen från sina inlägg på sociala medier är ett mångfacetterat problem. Den första utmaningen är att förstå betydelsen av den publicerade texten, ett forskningsområde som kallas Natural Language Processing (NLP). "Målet med NLP är att göra datorer lika intelligenta som människor när det gäller att förstå språk, " säger Zhang. "Det är en av de mest utmanande uppgifterna för AI, "tillägger hon.

    Regelbaserade NLP-modeller har inte varit särskilt framgångsrika med att tolka språkets nyans på det sätt som människor använder ord på olika och kreativa sätt, så att ordens betydelse ofta kan vara starkt beroende av sammanhanget. Ett alternativt tillvägagångssätt är att tillämpa maskininlärning för att representera ord i ett semantiskt utrymme – där semantiskt relaterade ord t.ex. Paris, Peking och Riyadh - kartläggs nära varandra.

    För att identifiera Twitter-användares intressen genom att analysera deras tweets, den viktigaste utmaningen är att karakterisera enskilda användare med deras viktigaste sökord. Zhang och hennes team har skapat en inbäddningsmodell där ord och användare hanteras tillsammans. "Vi skapade en modell för dynamisk användare och ordinbäddning som gemensamt och dynamiskt kan lära sig användar- och ordrepresentationer i samma semantiska utrymme, " säger Zhang.

    Kredit:King Abdullah University of Science and Technology

    Forskarna förbättrade modellens resultat genom att utveckla och införliva en komponent för diversifiering av strömmande sökord, som kan identifiera närbesläktade sökord och ta bort överflödiga poster från den översta sökordslistan. Den resulterande modellen kan fånga en mångfald av intressen för varje användare och anpassa sig till deras utvecklande intressen över tiden.

    När teamet testade sin modell på en uppsättning tweets, det var en betydande förbättring jämfört med tidigare tillvägagångssätt, säger Zhang. "Vår modell överträffar betydligt många toppmoderna användarprofileringsmodeller." Teamet har redan tagit fram en ny iteration av sin inbäddningsmodell, lägger hon till, där användar-användarrelationer också fångas för att börja identifiera intressen som användare har gemensamma. "Nästa modell kommer att vara mer avancerad och bygga dynamiska saminbäddningsvektorer som fångar användarens sociala närhet och användarattributets relevans samtidigt, " säger Zhang.


    © Vetenskap https://sv.scienceaq.com