Statistiska test som t TL; DR (för lång; läste inte) Använd n s Och standardavvikelsen för provet är: s Statistik kretsar kring att göra uppskattningar för hela populationer baserade på mindre prover från befolkningen och redovisa eventuell osäkerhet i uppskattning i processen. Standardavvikelser kvantifierar mängden variation i befolkningen du studerar. Om du försöker hitta medelhöjden får du ett resultatkluster runt medelvärdet (medelvärdet), och standardavvikelsen beskriver bredden på klustret och fördelningen av höjder över hela befolkningen. Standardavvikelsen "urval" uppskattar den verkliga standardavvikelsen för hela befolkningen baserat på ett litet urval från befolkningen. För det mesta kommer du inte att kunna ta prov på hela befolkningen i fråga, så standardavvikelsen är ofta rätt version att använda. Du behöver dina resultat och antalet ( n Som ett exempel hjärtfrekvensen (i slag per minut) av fem män och fem kvinnor är: 71, 83, 63, 70, 75, 69, 62, 75, 66, 68 Vilket leder till ett medelvärde av: μ \u003d 702 ÷ 10 \u003d 70.2 Nästa steg är att subtrahera medelvärdet från varje enskild mätning och sedan kvadratera resultatet. Som ett exempel för den första datapunkten: (71 - 70.2) 2 \u003d 0.8 2 \u003d 0.64 Och för den andra: (83 - 70.2) 2 \u003d 12.8 2 \u003d 163.84 Du fortsätter på detta sätt genom data och lägger sedan till resultaten. Så för exempeldata är summan av dessa värden: 0,64 + 163,84 + 51,84 + 0,04 + 23,04 + 1,44 + 67,24 +23,04 + 17,64 + 4,84 \u003d 353,6 Nästa steg skiljer mellan provstandardavvikelsen och befolkningsstandardavvikelsen. För provavvikelsen delar du detta resultat med provstorleken minus en ( n Detta resultat ger provvariansen, betecknad med s s Provets standardavvikelse ( s s Om du beräknade befolkningsstandardavvikelsen ( σ Hela formel för provstandardavvikelse kan uttryckas med hjälp av summeringssymbolen Σ, med summan över hela provet och x s Och provets standardavvikelse är helt enkelt: s Medelavvikelsen skiljer sig något från standardavvikelsen. Istället för att kvadratera skillnaderna mellan medelvärdet och varje värde, tar du istället den absoluta skillnaden (ignorerar några minustecken) och hittar sedan genomsnittet för dessa. För exemplet i föregående avsnitt ger de första och andra datapunkterna (71 och 83): x x Den tredje datapunkten ger ett negativt resultat x Men du bara ta bort minustecknet och ta detta som 7.2. Summan av alla dessa ger dividerat med n (0,8 + 12,8 + 7,2 + 0,2 + 4,8 + 1,2 + 8,2 + 4,8 + 4,2 + 2,2) ÷ 10 \u003d 46,4 ÷ 10 \u003d 4,64 Detta skiljer sig väsentligt från standardavvikelse beräknad tidigare, eftersom det inte involverar kvadrater och rötter.
-testet beror i huvudsak på begreppet standardavvikelse. Varje student i statistik eller naturvetenskap kommer att använda standardavvikelser regelbundet och måste förstå vad det betyder och hur man hittar det från en uppsättning data. Tack och lov är det enda du behöver originaldata, och även om beräkningarna kan vara tråkiga när du har mycket data, bör du i dessa fall använda funktioner eller kalkylbladdata för att göra det automatiskt. Men allt du behöver göra för att förstå nyckelbegreppet är att se ett grundläggande exempel som du enkelt kan träna ut för hand. Kärnan mäter provavvikelsen hur mycket mängden du har valt varierar mellan hela populationen baserat på ditt prov.
för att betyga provstorlek, μ
för genomsnittet av data, x
i för varje enskild datapunkt (från i
\u003d 1 till i
\u003d n
), och Σ som en summeringstecken är provvariansen ( s och 2):
2 \u003d (Σ x
i - μ
) 2 /( n
- 1)
\u003d √ s
2 - Standardavvikelse jämfört med standardavvikelseprov
Hitta provstandardavvikelsen
) personer i ditt prov. Beräkna först medelvärdet för resultaten ( μ
) genom att lägga till alla enskilda resultat och sedan dela detta med antalet mätningar.
\u003d (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10
−1). I vårt exempel n
\u003d 10, så n
- 1 \u003d 9.
< sup> 2, som för exemplet är:
2 \u003d 353.6 ÷ 9 \u003d 39.289
) är bara den positiva kvadratroten för detta nummer:
\u003d √39.289 \u003d 6.268
) den enda skillnaden är att du delar med n
snarare än n
−1.
i representerar i_th resultatet från _n
. Exempelvariansen är:
2 \u003d (Σ x
i - μ
) 2 /( n
- 1)
\u003d √ s
2 - Medelavvikelse jämfört med standardavvikelse |
1 - μ
\u003d 71 - 70.2 \u003d 0.8
2 - μ
\u003d 83 - 70.2 \u003d 12.8
3 - μ
\u003d 63 - 70.2 \u003d −7.2
ger medelavvikelsen. I exemplet: