Statussida för “End of Watch (Bill Hodges Trilogy #3) av Stephen King”. Kredit:Maity, Panigrahi och Mukherjee.
Forskare vid Northwestern University, Microsoft Research Indien, och Indian Institute of Technology Kharagpur har nyligen utvecklat en modell för att förutsäga om en bok kommer att bli en bästsäljare på Amazon inom 15 dagar efter publiceringen. Deras modell, beskrivs i en studie som förpublicerad på arXiv, fungerar genom att analysera läsbeteende på onlineplattformen Goodreads.
"Vi har arbetat med att analysera popularitetsdynamiken för olika sociala medier, som hashtags på Twitter, ämnen i Quora etc." Animesh Mukherjee, en av forskarna som genomförde studien berättade för TechXplore. "Vi ansåg att ett liknande tillvägagångssätt kunde användas för att analysera böckers popularitet och vi fann att Goodreads var idealiskt för den här undersökningen."
En bok popularitet beror på en mängd faktorer och kan mätas med hjälp av flera parametrar. I deras studie, forskarna fokuserade på hur bokläsningsegenskaper påverkar dess popularitet. De gjorde en plattformsoberoende analys av Goodreads-enheter och försökte koppla dessa till försäljningsvolymen för böcker på Amazon.
"Vi följde intuitionen att böckernas popularitet mestadels drivs av dess läsare, därav motivationen att extrahera läsbeteende för att förstå böckernas framtida popularitet, ", sade Mukherjee. "Ett av de bästa sätten att kvantifiera populariteten av böcker är att titta på dess försäljningsrekord. Således, vi försökte kvantifiera uppfattningen om popularitet i termer av Amazons bästsäljare."
Till att börja med, forskarna analyserade användarnas kollektiva läsbeteende på Goodreads. De kvantifierade sedan olika karaktäristiska egenskaper hos Goodreads-enheter, som skulle kunna användas för att identifiera skillnader mellan Amazons bästsäljare och andra mindre sålda böcker. Till sist, de utvecklade en maskininlärningsbaserad modell som använder dessa karakteristiska egenskaper för att förutsäga om en bok kommer att bli en storsäljare 15 dagar efter publiceringen.
"Vi använde toppmoderna maskininlärningsmodeller för att utföra våra förutsägelser, " förklarade Mukherjee. "Vi observerade att betygen och recensionerna som en bok om Goodreads fått inte är lika effektiva för att förutsäga bästsäljarna som användarnas lässtatusinläggsmönster. Till exempel, i Goodreads, en läsare kan skriva hur mycket av boken som har lästs, vilken sida han/hon är på, kan kommentera boken etc. Vi tycker att dessa funktioner är mycket effektiva för att förutsäga om boken kommer att bli en storsäljare i framtiden. "
Karakteristiska egenskaper för Goodreads-användares statusinlägg:distribution av a) antal statusuppdateringar per användare b) antal unika användare som uppdaterar status c) antal användare som uppdaterar flera gånger d) ankomsttid mellan status e) genomsnittlig maximal avläsningssträcka f ) genomsnittlig tid att läsa färdigt för ABS jämfört med andra böcker. Kredit:Maity, Panigrahi och Mukherjee.
Deras modell uppnådde en mycket lovande genomsnittlig noggrannhet på 88,72 procent för att förutsäga böcker som skulle bli Amazonas bästsäljare några veckor efter publiceringen. Deras metod, som baserades på funktioner härledda från användarinlägg och genrerelaterade egenskaper, uppnått en förbättring med 16,4 procent jämfört med baslinjemetoder som endast använder traditionella popularitetsfaktorer, såsom bokbetyg eller recensioner.
"En av de viktigaste insikterna som vi får från denna studie är att Amazons bästsäljande böcker inte nödvändigtvis är kvalificerade av högkvalitativa recensionstexter från läsarna eller en hög volym av betyg, "Mukherjee sa." Däremot, en stor majoritet av dem har inläggsmönster för läsarstatus som starkt skiljer dem från resten av böckerna."
Forskarna utvärderade också hur väl deras metod kunde förutsäga ytterligare två typer av böcker:högt rankade böcker som får ett stort antal recensioner men inte är bästsäljare (HRHR), och Goodreads Choice Award-nominerade (GCAN) böcker som inte är bästsäljare. De uppnådde en hög genomsnittlig noggrannhet på 87,1 procent för GCAN och på 86,22 procent för HRHR-böcker.
"Vi tror att detta arbete är ett viktigt bidrag till den aktuella litteraturen eftersom det inte bara utvecklar det kollektiva läsbeteendet hos en läsplattform för sociala böcker genom en rigorös mätningsstudie utan också etablerar en stark koppling mellan två ortogonala kanaler – Goodreads och Amazon, "Sa Mukherjee.
Modellen utvecklad av Mukherjee och hans kollegor skulle kunna främja utvecklingen av verktyg som överbryggar Amazon och Goodreads via nya plattformsoberoende policydesigner. De tror att sådana interaktioner kan vara en av anledningarna bakom Amazons förvärv av Goodreads i mars 2013. Forskarna vill nu utöka sin studie genom att ytterligare analysera användarnas läsbeteende.
"Det finns flera riktningar som vi planerar att utforska i framtiden, ", sa Mukherjee. "Den ena är att undersöka populariteten för olika genrer av böcker – till exempel, vilka är statusinläggsmönstren över olika genrer av böcker? En annan är att studera den dynamiska dynamiken i genre- och läsardemografi. Till exempel, hur skiljer sig läsbeteende hos män från kvinnor, eller hur skiljer de sig åt mellan olika kontinenter?"
© 2018 Tech Xplore