Resultat sorterade efter relevans, istället för datum, ge en förbättrad upplevelse för användare av PubMed, världens största biomedicinska litteraturdatabas, enligt en studie som publicerades den 28 augusti i tidskriften open access PLOS Biologi av Zhiyong Lu och kollegor vid National Library of Medicine (NLM)/National Center for Biotechnology Information (NCBI), som utvecklar och underhåller PubMed.
PubMed innehåller över 28 miljoner artikelabstrakt från den biomedicinska litteraturen, med i genomsnitt två till varje minut. Det är en oumbärlig resurs, globalt i omfattning, åtkomst av miljontals användare varje dag. Från starten, sökresultaten returnerades endast i omvänd kronologisk ordning, senaste först, ett rankningssystem som betonade aktualitet snarare än relevans för sökfrågan. Under 2013, ett relevansrankningssystem infördes, men det berodde på artificiella viktningsfaktorer och krävde kontinuerlig manuell justering.
I juni 2017, NLM/NCBI-personal introducerade en maskininlärningsalgoritm som bygger på dussintals relevanssignaler inklusive användarsvar – specifikt, frekvensen av klickningar till artiklarna som returneras för en given sökning – för att förbättra relevansrankningen. Detta rankingsystem, kallas Bästa match, erbjuds som ett alternativ till kronologisk ordning. Teamet fann att klickfrekvensen ökade med 20 % på de returnerade resultaten av Best Match jämfört med samma resultat som presenteras kronologiskt. Den totala användningen av relevanssortering ökade från 7,5 % av alla sökningar före introduktionen av Best Match till 12 % i april 2018. Eftersom maskininlärningssystem är beroende av användarinput för att förbättra, den ökade användningen bör göra det möjligt för systemet att "lära sig själv" att bli mer värdefullt för sina användare med tiden.
"Övergripande, den nya Best-Match-algoritmen visar en betydande förbättring när det gäller att hitta relevant information över standardtidsordningen i PubMed, ", sade författarna. "Vi uppmuntrar PubMed-användare att prova denna nya relevanssökning och ge input för att hjälpa oss att fortsätta att förbättra rankningsmetoden."