Kredit:Pixabay/CC0 Public Domain
Föreställ dig att det finns en buss som anländer var 30:e minut i genomsnitt och du anländer till busshållplatsen utan en aning om när den sista bussen gick. Hur länge kan du förvänta dig att vänta på nästa buss? Intuitivt, hälften av 30 minuter låter rätt, men du skulle ha tur att vänta bara 15 minuter.
Säga, till exempel, att halva tiden kommer bussarna med 20 minuters mellanrum och halva tiden med 40 minuters mellanrum. Det totala snittet är nu 30 minuter. Ur din synvinkel, dock, det är dubbelt så troligt att du dyker upp under 40-minutersintervallet än under 20-minutersintervallet.
Detta gäller i alla fall utom när bussarna anländer med exakta 30 minuters mellanrum. När spridningen runt genomsnittet ökar, så gör det belopp med vilket den förväntade väntetiden överstiger den genomsnittliga väntetiden. Detta är inspektionsparadoxen, som säger att när du "inspekterar" en process, du kommer sannolikt att upptäcka att saker tar (eller håller) längre än deras "okontrollerade" genomsnitt. Det som verkar som oturens ihållande är helt enkelt sannolikhetslagarna och statistik som spelar ut sin naturliga gång.
När man väl blev medveten om paradoxen, det verkar dyka upp överallt.
Till exempel, låt oss säga att du vill göra en undersökning av den genomsnittliga klassstorleken på en högskola. Säg att skolan har klassstorlekar på antingen 10 eller 50, och det finns lika många av varje. Så den totala genomsnittliga klassstorleken är 30. Men när man väljer en slumpmässig elev, det är fem gånger mer sannolikt att han eller hon kommer från en klass med 50 elever än på 10 elever. Så för varje elev som svarar "10" på din förfrågan om sin klassstorlek, det kommer att vara fem som svarar "50". Den genomsnittliga klassstorleken som visas av din undersökning är närmare 50, därför, än 30. Så åtgärden att inspektera klassstorlekarna ökar avsevärt det erhållna genomsnittet jämfört med det sanna, okontrollerat genomsnitt. Den enda omständigheten där det inspekterade och okontrollerade genomsnittet sammanfaller är när varje klassstorlek är lika.
Vi kan undersöka samma paradox inom ramen för det som kallas längdbaserad sampling. Till exempel, när man gräver upp potatis, varför går gaffeln genom den mycket stora? Varför bryts nätverksanslutningen vid nedladdning av den största filen? Det är inte för att du föddes otur utan för att dessa utfall inträffar för en större förlängning av rum eller tid än den genomsnittliga förlängningen av rum eller tid.
När du väl känner till inspektionsparadoxen, världen och vår uppfattning om vår plats i den är aldrig riktigt sig lik igen.
En annan dag ställer du upp på läkarmottagningen för att testas för virus. Testet är 99% korrekt och du testar positivt. Nu, vad är chansen att du har viruset? Det intuitiva svaret är 99%. Men är det rätt? Informationen vi får avser sannolikheten att testa positivt givet att du har viruset. Vad vi vill veta, dock, är sannolikheten att ha viruset givet att du testar positivt. Gemensam intuition förenar dessa två sannolikheter, men de är väldigt olika. Det här är ett exempel på det omvända eller åklagarens felslut.
Betydelsen av testresultatet beror på sannolikheten att du har viruset innan du tar testet. Detta är känt som den tidigare sannolikheten. Väsentligen, vi har en konkurrens mellan hur sällsynt viruset är (basfrekvensen) och hur sällan testet är fel. Låt oss säga att det finns en chans på 1 på 100, baserat på lokala prevalensfrekvenser, att du har viruset innan du tar testet. Nu, kom ihåg att testet är fel en gång av 100. Dessa två sannolikheter är lika, så chansen att du har viruset när du testar positivt är 1 av 2, trots att testet var 99% korrekt. Men vad händer om du visar symptom på viruset innan du testas? I detta fall, vi bör uppdatera den tidigare sannolikheten till något högre än prevalensen i den testade populationen. Chansen att du har viruset när du testar positivt ökar i enlighet därmed. Vi kan använda Bayes sats för att utföra beräkningarna.
Sammanfattningsvis, intuitionen sviker oss ofta. Fortfarande, genom att tillämpa metoderna för sannolikhet och statistik, vi kan trotsa intuitionen. Vi kan till och med lösa det som för många kan tyckas vara det största mysteriet av dem alla – varför vi så ofta tycks hamna i den långsammare körbanan eller kön. Intuitivt, vi föddes med otur. Det logiska svaret på Slower Lane Puzzle är att det är precis där vi bör förvänta oss att vara!
När intuitionen misslyckas, vi kan alltid använda sannolikhet och statistik för att leta efter de verkliga svaren.