Kredit:CC0 Public Domain
Ett team av datavetare vid USC Viterbi School of Engineering satte sig för att utveckla nya verktyg för att automatisera och organisera samhällsvetenskaplig data. Vad använde de som sina datamängder? Twitter-inlägg från kuststäderna, New York City och Los Angeles.
Forskarna fann att de kunde identifiera liknande tweets som inte har hashtags genom att använda naturlig språkbehandling och neurala nätverk för att skapa kluster av likadana tweets. "Den använder AI för att skapa en karta över liknande tweets, " säger Mayank Kejriwal, en forskarassistent vid USC Department of Industrial and Systems Engineering, och en forskningsledare vid USC Information Sciences Institute, som är expert på kunskapsgrafer.
Det nya verktyget tar tweets och omvandlar dem till en matematisk vektor med hjälp av ett neuralt nätverk, så att du kan se om två punkter liknar varandra. Således, du kan se kluster av relaterade inlägg. Till exempel, AI:n kan avgöra om tweets som "Lounging on the beach, tänker på mitt liv" och "Idag är det surfing, solbad och mindfulness" är väldigt lika, trots att de nästan inte har några ord gemensamt.
När man jämför Angelenos med New York-bor, de hittade några intressanta trendinlägg.
Nej. Angelenos pratade inte om 405 lika mycket som NY-are pratade om LÖGNEN. Och ingen av grupperna talade om fastigheter som ett huvudämne.
Det bästa klustret av tweets i LA? Kring ämnet "jobb".
Det finns ofta en uppfattning om att LA är fåfängt. New York City och New York är bland de fem bästa sakerna som New York-bor twittrar om.
Hur är det med konsten? Konst verkar dominera samtalet för Los Angeles mer än i New York. Men dela efter befolkning, och den genomsnittlige New Yorker visar sig vara mer konstnärlig.
Tvärtemot vad många tror, uppkopplad, Angelenos tenderade att prata om hälso- och sjukvård inte om välbefinnande.
New York, dataprovet avslöjar, kan faktiskt, vara "Staden som aldrig sover" som forskarna säger att dess invånare blir levande på natten. men Angelenos, tro det eller ej, har större mun – de lägger ut mer på sociala medier. Under kontorstid, Angelenos brukar posta mellan 30-60 % fler tweets än New York-bor. Efter 20.00, det är ingen skillnad mellan de två.
I både LA och New York, områden med högre inkomst twittrar mer.
Datauppsättningen togs ut från oktober 2016. Forskningen dokumenterades i Journal of Computational Social Science.
"Studier som denna tillåter oss att förstå nyanserna i det 21:a århundradets vardag. Vi lever i en sådan upprördhet, kändisdriven kultur idag att det är lätt att glömma att de flesta av oss bara är fokuserade på att göra vårt jobb:att äta, pendling, arbetssätt, klagar. Vi dokumenterar mer av det på sociala medier än vi inser. Den här tekniken låter oss läsa historien om vårt samhälle – när den skrivs, mitt framför våra ögon, " säger Kejriwal.