Rätt samplingsstorlek är ett viktigt övervägande för dem som utför undersökningar. Om provstorleken är för liten kommer de erhållna provdata inte att vara en exakt reflektion av de data som är representativa för befolkningen. Om provstorleken är för stor blir undersökningen för dyr och tidskrävande att slutföra. Om ditt undersökningsmål var att hitta den genomsnittliga åldern för kvinnor i USA skulle det vara opraktiskt att fråga varje kvinna sin ålder.
Bestämningen av provstorleken kräver att du definierar konfidensnivån du vill ha och graden av fel du kommer att tolerera, och att du antingen vet eller har en uppskattning av standardavvikelsen för populationsparametern som du försöker bestämma.
Definiera felnivån du tolererar. Välj ett värde som ger ett resultat som är mindre än 5 procent av befolkningsparametern som du försöker uppskatta. Tänk på att ju högre felnivån tolererade desto mindre signifikanta resultat är dina undersökningsresultat.
Tänk på en situation där du skulle behöva hitta den genomsnittliga åldern för kvinnor (befolkningsparametern) i USA. Först gör du en uppskattning av kvinnornas medelålder. För den uppskattningen använd en tidigare studie och multiplicera det där numret med 0,05 för att hitta felet.
Om en studie inte är tillgänglig beräknar du grovt medelåldern för kvinnor själv. För den uppskattningen, skaffa data med 10 olika enkäter som har en provstorlek på 31 kvinnor vardera. Beräkna medelåldern för de 31 kvinnorna för varje undersökning. Beräkna sedan medelvärdet av medel för alla undersökningar. Använd detta nummer som uppskattning av medelåldern för kvinnor. Multiplicera sedan det numret med 0,05 för att få felet. Om medelvärdet av de medel som erhölls för dina undersökningar var 40, multiplicera 0,05 (5 procent) gånger 40 för att få 2. Så välj det fel du tolererar vara inom två år.
Skriv detta nummer nere; du kommer att använda den för att beräkna provstorleken. Om du använder 2 för felet för din provberäkning kommer din undersökning att ge ett resultat som är korrekt inom två år av den faktiska medelåldern för kvinnor i befolkningen. Kom ihåg att ju mindre felet är desto större blir provstorleken.
Definiera konfidensnivån du vill använda. Välj en konfidensnivå på 90, 95 eller 99 procent. Använd en högre konfidensnivå om du vill öka sannolikheten att resultaten från din urvalsundersökning kommer att ligga inom den feltolerans du beräknade i föregående steg. Kom ihåg att ju högre konfidensnivå du väljer, desto större blir provstorleken.
Bestäm det kritiska värdet för det angivna konfidensintervallet. För ett konfidensnivå på 90 procent, använd ett kritiskt värde på 1.645. För ett 90 procent konfidensintervall, använd ett kritiskt värde på 1.960, och för en konfidensnivå på 99 procent, använd ett kritiskt värde på 2.575. Skriv detta nummer ner; du kommer att använda den för att beräkna provstorleken.
Ta reda på standardavvikelsen för populationsparametern du försöker uppskatta med din undersökning. Använd standardavvikelsen för populationsparametern som anges i problemet eller beräkna standardavvikelsen. Om det inte anges, använd standardavvikelsen från en liknande studie. Om det inte finns tillgängligt beräknas grovt en standardavvikelse så att den blir ungefär 34 procent av befolkningen.
För det exempel som anges i steg 1, antar att 20 år är en standardavvikelse. För en medelålder av 40 skulle det innebära att 68 procent av kvinnorna i befolkningen uppskattas vara mellan 20 år och 60 år.
Beräkna provstorleken. Först multiplicera det kritiska värdet med standardavvikelsen. Dela sedan detta resultat med felet från steg 1. Nu kvadrera resultatet. Detta resultat är provstorleken.
För ett problem som använder ett konfidensintervall på 90 procent (ett kritiskt värde på 1.645) specificeras ett fel inom två år och ger en befolkningsstandardavvikelse på 20 år, först multiplicera 1,645 med 20 för erhållande av 32,9. Dela 32,9 med 2 för att få 16,45. Kvadrat 16,45 för att erhålla 270,6. Runda upp till nästa högsta heltal för att få en provstorlek på 271.
Ange villkoren för dina undersökningsresultat. För exemplet i steg 1 med en provstorlek på 271 kan du vara 90 procent säker på att medelvärdet av provet på 271 kvinnor kommer att ligga inom två år av det faktiska medelvärdet av den totala kvinnornas befolkning. Så om din undersökning resulterade i en medelålder på 43 år, kan du kontrollera att det finns en 90 procent chans att den genomsnittliga åldern för kvinnornas befolkning i USA kommer att ligga mellan 42 och 44.