Provstorleken representerar antalet observationer som gjorts för att utföra en statistisk analys. Provstorlekar kan bestå av människor, djur, livsmedelsbatcher, maskiner, batterier eller vad som helst populationsvärdering.
Slumpmässig provtagning
Slumpmässig provtagning är en metod genom vilken slumpmässiga prov samlas in från en befolkning för att uppskatta information om befolkningen utan att vara partisk. Om du till exempel vill veta vilken typ av person som bor i en viss stad, måste du intervjua /mäta olika personer slumpmässigt. Men om du bara använde alla från biblioteket, skulle du inte ha en rättvis och opartisk uppskattning av vad den allmänna befolkningen som upptar staden är, bara de personer som går till biblioteket.
Precision
När provstorlekarna ökar blir estimaten mer exakta. Till exempel, om vi slumpmässigt valt 10 manliga vuxna människor, kan vi finna att deras genomsnittliga höjd är 6 meter lång och 3 tum lång, kanske för att det finns en basketbollsspelare som blåser upp vår uppskattning. Om vi emellertid mättar två miljoner vuxna manliga människor, skulle vi få en bättre förutsägare för männs medelhöjd eftersom extremiteterna skulle balansera och det sanna genomsnittet skulle överhämta några avvikelser från medelvärdet.
Förtroendeintervaller
När en statistiker gör en förutsägelse om ett resultat, kommer han ofta att bygga ett intervall runt sin uppskattning. Till exempel, om vi mäter vikten på 100 kvinnor, kan vi säga att vi är 90 procent övertygade om att den sanna genomsnittliga vikten av kvinnor ligger i intervallet 103 till 129 pund. (Detta beror naturligtvis på andra faktorer som variation i mätningarna också.) Eftersom provstorleken ökar blir vi mer säkra på vår uppskattning och våra intervaller blir mindre. Till exempel med en miljon kvinnor kan vi säga att vi är 98 procent övertygade om att den sanna, genomsnittliga vikten av kvinnor är mellan 115 och 117 pund. Med andra ord, när provstorleken ökar, ökar vårt förtroende för våra mätningar och storleken på våra konfidensintervaller minskar.
Standardfel
Variation är ett mått på spridningen av data runt genomsnittet . Standardavvikelsen är kvadratroten av variation och hjälper till att approximera vilken procentandel av befolkningen som faller mellan ett antal värden i förhållande till medelvärdet. När provstorleken ökar, minskar standardfelet, vilket beror på standardavvikelsen och provstorleken. Följaktligen ökar beräkningarna i precision, och forskning som bygger på dessa uppskattningar anses vara mer tillförlitlig (med mindre risk för fel).
Svårighetsgrad vid användning av större provstorlekar
Större provstorlekar producerar givetvis bättre, mer exakta uppskattningar om populationer, men det finns flera problem med forskare som använder större provstorlekar. Först och främst kan det vara svårt att hitta ett slumpmässigt urval av personer som är villiga att prova ett nytt läkemedel. När du gör det blir det dyrare att ge drogen till fler människor och att övervaka fler människor över tiden. Dessutom tar det mer ansträngning att vinna och behålla en större provstorlek. Även om större provstorlekar ger mer exakt statistik behövs inte extra kostnad och insats eftersom mindre provstorlekar också kan ge betydande resultat.