Av Kevin Beck, uppdaterad 30 augusti 2022
Föreställ dig att du vill veta hur din 12 veckor gamla renrasiga valps vikt står sig mot andra hundar av samma ålder, kön och ras över hela världen. Om du har tillgång till en omfattande databas kan du jämföra din valps vikt med genomsnittet av befolkningen och se hur den rankas. Men vad händer om du bara har en handfull datapunkter och fortfarande vill bedöma hur ett visst värde relaterar till den bredare befolkningen?
I sådana fall kommer två statistiska verktyg in i bilden:z-poängen och t-poängen . Båda hjälper dig att förstå hur en specifik observation kan jämföras med ett "typiskt" värde, men de används under olika omständigheter.
medelvärdet (genomsnitt) av en datamängd är summan av alla värden dividerat med antalet observationer, n . För en population betecknas medelvärdet med μ , och standardavvikelsen med σ . I en standardnormalfördelning ligger cirka 68 % av observationerna inom ±1σ av medelvärdet och cirka 95 % inom ±2σ.
Storleken på standardavvikelsen i förhållande till medelvärdet indikerar spridningen av data:en större σ ger en bredare klockkurva, medan en mindre σ resulterar i en smalare.
En z-poäng mäter hur många standardavvikelser en enskild observation, x , är från populationens medelvärde:Z =(x – μ) / σ . Ett z-värde på 0 betyder att observationen är lika med medelvärdet; +1,00 och –1,00 indikerar en standardavvikelse över respektive under medelvärdet.
Ett t-poäng är liknande men använder exempelmedelvärdet (𝑥̄ ) och provets standardavvikelse (s ), och inkluderar urvalsstorleken:t =(𝑥̄ – μ) / (s / √n) . Nämnaren representerar standardfelet för medelvärdet.
Om ditt prov innehåller färre än 30 observationer är ett t-poäng att föredra framför ett z-poäng. När urvalsstorleken växer konvergerar t-fördelningen mot normalfördelningen, vilket gör skillnaden försumbar för stor n . Valet av konfidensintervall – vanligtvis 90 % eller 95 % för tvåsidiga tester – bestämmer det kritiska värde du jämför ditt t-score mot.
Anta att en klass med 25 universitetsstudenter har i genomsnitt 64 % på ett Harry Potter-överraskningstest. Populationens medelvärde är 60 % och urvalets standardavvikelse är 15 %. Så här beräknar du t-poängen:
t = (64 – 60) / (15 / √25) = 4 / (15 / 5) = 4 / 3 ≈ 1.33
Frihetsgraderna är df = n – 1 = 24 . Om man slår upp en 90 % konfidensnivå i en t-fördelningstabell (eller använder en online-kalkylator), är det kritiska värdet för 24df cirka 1,711. Sedan 1,33 < 1,711 är klassgenomsnittet inte signifikant högre än befolkningens medelvärde på 90 % konfidensnivå.
Att justera konfidensintervallet (t.ex. till 80 % eller 70 %) skulle ändra det kritiska värdet och kan ändra slutsatsen.
För mer detaljerade tabeller och miniräknare, konsultera välrenommerade källor såsom Wikipedia-posten om t-distribution eller statistisk programvara som R eller Pythons SciPy-bibliotek.