Av Gina Putt • Uppdaterad 30 augusti 2022
När data som uppstår naturligt – som höjd, IQ eller blodtryck – plottas på ett histogram, bildar frekvenserna för poängen vanligtvis en symmetrisk, klockformad kurva som kallas en normal (eller gaussisk) fördelning. Denna form gör det möjligt för statistiker att göra kraftfulla förutsägelser om sannolikheten att observera en viss poäng.
Det aritmetiska medelvärdet av en normalfördelning sitter i kurvans centrum och motsvarar den 50:e percentilen:hälften av alla observationer faller över den och hälften under. Eftersom kurvan är perfekt symmetrisk, sammanfaller medianen med medelvärdet, vilket markerar punkten med störst frekvens.
Standardavvikelsen kvantifierar hur långt, i genomsnitt, individuella poäng ligger från medelvärdet. En större standardavvikelse ger en plattare, mer spridd kurva, medan en mindre ger en brant, smal form. Varje standardavvikelsesteg flyttar dig längre från medelvärdet och minskar sannolikheten för att en slumpmässig poäng kommer att falla där.
I en normalfördelning ger den empiriska regeln följande landmärkessannolikheter:
Dessa procentsatser utgör ryggraden i statistisk slutledning. Till exempel, om en klinisk prövning visar att patienter som tar ett nytt kolesterolsänkande läkemedel har genomsnittliga nivåer två standardavvikelser under populationens medelvärde, beror det sannolikt inte på att resultatet enbart beror på slumpen.