Statistik handlar om att dra slutsatser inför osäkerhet. När du tar ett prov kan du inte vara helt säker på att ditt prov verkligen återspeglar den befolkning som det har tagits från. Statistiker hanterar denna osäkerhet genom att ta hänsyn till faktorer som kan påverka uppskattningen, kvantifiera deras osäkerhet och utföra statistiska test för att dra slutsatser från dessa osäkra data.
Statistiker använder konfidensintervall för att ange ett intervall av värden som är sannolikt att innehålla den "sanna" befolkningsmedlet på grundval av ett urval och uttrycka deras säkerhetsnivå i detta genom förtroendegrader. Även om det inte ofta är användbart att beräkna konfidensnivåer, är det mycket användbart att beräkna konfidensintervall för en viss konfidensnivå.
TL; DR (för lång; läste inte) |
Beräkna en konfidensintervall för en viss konfidensnivå genom att multiplicera standardfelet med Z Upprepa samma process men med t Hitta en konfidensnivå för en datauppsättning genom att ta hälften av storleken på konfidensintervallet, multiplicera den med kvadratroten i provstorleken och sedan dela med provets standardavvikelse. Slå upp den resulterande Z När du ser en citerad statistik finns det ibland ett intervall som ges efter det, med förkortningen "CI" (för "konfidensintervall") eller helt enkelt en plus-minus-symbol följt av en siffra. Till exempel "medelvikt för en vuxen man är 180 pund (CI: 178,14 till 181,86)" eller "medelvikt för en vuxen man är 180 ± 1,86 pund." Dessa båda berättar samma information: baserat på provet används, faller en mans medelvikt troligen inom ett visst intervall. Själva intervallet kallas konfidensintervallet. Om du vill vara så säker som möjligt att intervallet innehåller det verkliga värdet kan du bredda intervallet. Detta skulle öka din "konfidensnivå" i uppskattningen, men intervallet skulle täcka fler potentiella vikter. De flesta statistik (inklusive den citerade ovan) ges som 95 procent konfidensintervall, vilket innebär att det finns 95 procent chans att det verkliga medelvärdet ligger inom intervallet. Du kan också använda en konfidensnivå på 99 procent eller en konfidensnivå på 90 procent, beroende på dina behov. När du använder en konfidensnivå i statistik behöver du vanligtvis det för att beräkna ett konfidensintervall. Detta är lite lättare att göra om du har ett stort urval, till exempel över 30 personer, eftersom du kan använda Z Ta dina rådata och beräkna provmedlet (lägg bara till de enskilda resultaten och dela med antalet resultat). Beräkna standardavvikelsen genom att subtrahera medelvärdet från varje enskilt resultat för att hitta skillnaden och kvadratera sedan denna skillnad. Lägg till alla dessa skillnader och dela sedan resultatet med provstorleken minus 1. Ta kvadratroten till detta resultat för att hitta provets standardavvikelse (se Resurser). Bestäm konfidensintervallet genom att först hitta standardfel: SE Där s SE För att hitta konfidensintervallet från detta, slå upp konfidensnivån du vill beräkna intervallet för i en Z Medel ± Z Här, ± 1,86 pund är 95 procent konfidensintervall. Om du har den här informationen istället, tillsammans med provstorleken och standardavvikelsen, kan du beräkna konfidensnivån genom att använda följande formel: Z Storleken på konfidensintervall är bara två gånger ± värdet, så i exemplet ovan vet vi 0,5 gånger detta är 1,86. Detta ger: Z Detta ger oss ett värde för Z För små prover finns det en liknande process för "calculating the confidence interval.", 3, [[Dra först 1 från din provstorlek för att hitta dina "grader av frihet." I symboler: df För ett prov n Hitta ditt alfavärde genom att subtrahera decimalversionen av konfidensnivån ( dvs. din procentuella konfidensnivå dividerad med 100) från 1 och dela resultatet med 2, eller i symboler: α α Leta upp ditt alfavärde och grader av frihet i en (en svans) t-distributionstabell och notera resultatet. Alternativt kan du utelämna delningen med 2 ovan och använda ett <-> -värde med två halar. I det här exemplet är resultatet 2.262. Som i föregående steg beräknar du konfidensintervallet genom att multiplicera detta nummer med standardfelet, vilket bestäms med hjälp av din provstandardavvikelse och provstorlek på samma sätt. Den enda skillnaden är att i stället för Z-poängen använder du t-poängen.
poäng för din valda konfidensnivå. Subtrahera detta resultat från ditt provmedelvärde för att få nedre gränsen och lägg till det i provmedlet för att hitta den övre gränsen. (Se resurser)
poäng i stället för Z
poäng för mindre prover ( n
<30 ).
eller t
poängen i en tabell för att hitta nivån.
Skillnaden mellan förtroendenivå kontra förtroendesintervall
Beräkna konfidensintervall eller nivåer för stora prover
poäng för din uppskattning snarare än mer komplicerade t
poäng.
\u003d s
/√ n
är din standardstandardavvikelse och n
är din provstorlek. Om du till exempel tog ett prov på 1 000 män för att räkna ut en mans medelvikt och fick ett standardavvikelse på 30, skulle detta ge:
\u003d 30 /√1000 \u003d 30 /31.62 \u003d 0,95
-score tabell och multiplicera detta värde med Z-poängen. För en 95-procentig konfidensnivå är Z
-score 1,96. Med hjälp av exemplet betyder detta:
× SE
\u003d 180 pund ± 1,96 × 0,95 \u003d 180 ± 1,86 pund
\u003d 0,5 × storleken på konfidensintervall × √ n
/ s
\u003d 1,86 × √1000 /30 \u003d 1,96
, som du kan slå upp i en Z
-score-tabell för att hitta motsvarande konfidensnivå.
Beräkna förtroendesintervaller för små prover
\u003d n
−1
\u003d 10 ger detta df
\u003d 9.
\u003d (1 - decimal konfidensnivå) /2
Så för en 95 procent (0,95) konfidensnivå:
\u003d (1 - 0,95) /2 \u003d 0,05 /2 \u003d 0,025