En bild av gränssnittet som Hosseini och hans team använde för att testa sin modell, ställa frågor om geografi till arbetstagare med crowdsourcing, filmer och konstverk att välja på, till exempel, vilken film från ett urval av fyra hade de mest inkomstbringande biljettintäkterna genom tiderna. Forskarna använde sex olika format för att få fram svar från deltagarna, som att välja det översta svaret från en lista med fyra val (som visas i Uppgift 2) eller rangordna dessa fyra val i ordning (som visas i Uppgift 8). Vissa deltagare ombads också att förutsäga vilket toppsvar andra skulle välja eller hur andra skulle rangordna sin ordning, som visas i båda exemplen. Kredit:Pennsylvania State University
Föreställ dig att du blir ombedd att rangordna länen i Pennsylvania när det gäller antalet COVID-19-infektioner. Eller du kan bli ombedd att rangordna följande städer i Pennsylvania baserat på deras befolkning:Harrisburg, Allentown, Erie och State College.
Vad skulle ditt svar vara? Hur tror du att andra skulle svara på dessa frågor?
En ny algoritm utvecklad av ett team av forskare ledd av Hadi Hosseini, biträdande professor vid Penn State College of Information Sciences and Technology, kan nå det sanna svaret på denna och liknande frågor genom att kombinera en respondents egen röst eller åsikt med deras förutsägelse om hur andra kommer att svara.
Hosseini förklarade att en person med kännedom om Pennsylvania med största sannolikhet skulle veta svaret på ovanstående fråga. De kan också förutse att andra mindre informerade deltagare, i genomsnitt, skulle ge den felaktiga rangordningen. Omvänt, uniformerade deltagare är sannolikt inte medvetna om det korrekta svaret och kan ge en felaktig rankning av dessa städer.
"Detta är kärnan i vår algoritm:att använda den extra information som informerade deltagare måste korrigera för sådana fel, " han sa.
Forskarnas metod expanderar på ett befintligt tillvägagångssätt för att begära visdom hos en folkmassa, kallas förvånansvärt populär metod, som har använts i scenarier som politiska opinionsmätare som förutsäger valresultatet och forskare som förutspår vinnarna av NFL-spel. Som Hosseinis modell, förvånansvärt populär metod ber respondenterna att ge två svar per fråga:vad deras egen åsikt eller röst är, och hur de förutspår att andra kommer att rösta. Tekniken utnyttjar kunskapen hos en liten grupp experter i en större skara för att peka på rätt svar.
Dock, den överraskande populära metoden har begränsats till att förutsäga ett enda korrekt svar på en ställd fråga, som "Vad är Pennsylvanias huvudstad?" eller "Hur mycket pengar tjänade filmen "Titanic" i kassan över hela världen?" Hosseinis modell utökar detta koncept till rankade val eller alternativ.
"Man behöver inte helt framkalla fullständiga rankningar och förutsägelser av andra, ", sade Hosseini. "Vi kan återvinna grundsanningen genom att kombinera både röstning och förutsägelser utan att framkalla full fördelning över alla möjliga n! ranking. Och detta gäller för att återställa antingen bara toppvalet eller hela rankingen."
Metoden skulle potentiellt kunna användas för att förbättra prognoser med rankade val, som i exit-undersökningar för att förutsäga utfallet av politiska val. Enligt Hosseini, genom att ställa sekundära frågor till väljarna genom sin metod, färre prover skulle krävas jämfört med vanliga exitundersökningar som förlitar sig på slumpmässigt urval.
Hosseinis tillvägagångssätt överträffar också avsevärt konventionella röstningsmetoder, som regel med enkel majoritet, som inte ber respondenterna att förutsäga hur andra kommer att svara.
"Det visar sig att förutsägelse av andras röster är viktigare än de faktiska rösterna, Hosseini sa. "Detta är väldigt viktigt eftersom det hävdar att det är en mer kritisk fråga att fråga vad du tycker om andra människors åsikter än att fråga deras egen åsikt."
För att testa deras modell, Hosseini och hans team ställde frågor om geografi till 720 arbetare med crowdsourcing, filmer och konstverk att välja på, till exempel, vilken film från ett urval av fyra har den mest inkomstbringande, alla tiders kassaintäkter. Forskarna använde sex olika format för att få fram svar från deltagarna, som att välja det översta svaret från en lista med fyra alternativ eller rangordna dessa fyra val i ordning. Vissa deltagare ombads också att förutsäga vilket toppsvar andra skulle välja eller hur andra skulle rangordna sin ordning.
"Våra algoritmiska metoder och resultat kan ha en betydande inverkan på hur vi ser och hanterar val, oavsett om det är på nationell eller lokal nivå, sade Hosseini. Ännu viktigare, vår teknik visar att vi kan förutsäga en sanningsrankning med hög noggrannhet utan behov av massiv datainsamling."
Dessutom, han sa, Metoden skulle kunna tillämpas på områden utanför prognoser för objektiva utfall av händelser som politiska val och sportspel.
"Förvånande, denna teknik fungerar även för att förutsäga prisrankningen för abstrakta målningar, vilket vanligtvis är mer utmanande att spekulera av publiken, " han lade till.
De presenterade sitt papper, "Förvånansvärt populär röstning återställer ranking, Överraskande!" denna vecka vid den internationella gemensamma konferensen om artificiell intelligens (IJCAI-21), hölls i stort sett 19-26 augusti. Arbetet finansierades delvis av National Science Foundation.