Alla dataset som ackumuleras för statistiska ändamål, till exempel USA: s folkräkning, innehåller information som måste sammanfattas och aggregeras. Det skulle vara omöjligt att lista attribut som inkomst och familjestorlek för varje individ. Statistiker använder därför frekvensdiagram för att avbilda data på ett omfattande sätt, såsom ett histogram, som delar upp data i klassintervaller och räknar frekvensen där alla medlemmar som hör till det klassintervallet uppträder. Även om det inte finns några strikta regler för hur man beräknar storleken och antalet klassintervaller finns det några konventionella kriterier som är användbara.
Beräkna dataintervallet. Sortimentet är skillnaden mellan de högsta och lägsta datapunkterna. Antag exempelvis att den högst betalda individen i USA tjänar 30 miljarder dollar om året och den lägsta tjänar noll. Sortimentet är lika med 30 - 0, vilket motsvarar 30 miljarder dollar.
Bestäm antal klasser från provstorleken. Som en tumregel används fem till sju klasser för provstorlek upp till 50, åtta till 10 klasser för provstorlek mellan 50 och 100, 10-15 klasser för provstorlek mellan 100 och 250 och 15 till 20 klasser för provstorlek större än 250.
Beräkna klassintervallet med följande formel: Klassintervall = intervall /antal klasser. För att beräkna klassintervallet för inkomstfördelning i exemplet, dela 30 med 15, vilket motsvarar 2 miljarder dollar. Ofta ignorerar statistiker extremt höga och låga siffror och fokuserar på mellanfrekvensfrekvenserna. Av denna anledning presenteras inkomstfördelning i USA i mindre intervall på $ 10 000 med inkomster som är större än en viss siffra, vanligtvis en miljon, klumpade ihop i ett enda klassintervall.
Använd ditt utrymme för skönsmässig bedömning vid beräkning av klassintervall. En grafs heliga grader, som ett histogram, är att förmedla relevant information på ett meningsfullt och enkelt sätt. Välj dina klassintervaller för att förmedla den information du anser vara värdig för läsarnas uppmärksamhet.