Alla datauppsättningar som samlats för statistiska ändamål, till exempel den amerikanska folkräkningsdata, innehåller information som kräver summering och aggregering. Det är nästan omöjligt att lista attributen, till exempel som individuella inkomster och familjestorlekar. Statistiker använder diagram för frekvensfördelning för att skildra data på ett omfattande sätt. Till exempel delar ett histogram upp data i klassintervall och räknar frekvensen vid vilken alla medlemmar som tillhör det klassintervallet inträffar. Även om det inte finns några strikta regler för hur man beräknar storleken och antalet klassintervall finns det några användbara konventionella kriterier.
Beräkna intervallet av data, dvs skillnaden mellan de högsta och lägsta datapunkterna. Antag till exempel att den högst betalda personen i USA tjänar 30 miljarder dollar per år och den lägsta tjänar noll. Området är lika med 30 - 0, vilket motsvarar 30 miljarder dollar.
Bestäm antalet klasser från provstorleken. Som tumregel används fem till sju klasser för provstorlek upp till 50, åtta till 10 klasser för provstorlek mellan 50 och 100, 10 till 15 klasser för provstorlek mellan 100 och 250 och 15 till 20 klasser för provstorlek större än 250.
Beräkna klassintervallet med följande formel: Klassintervall \u003d intervall ÷ antal klasser. Om du har 15 inkomstklasser i inkomstfördelningsexemplet, träna 30 ÷ 15 \u003d 2 miljarder dollar. Ofta ignorerar statistiker extremt höga och låga siffror och fokuserar på mellanregisterfrekvenserna. Av denna anledning presenteras inkomstfördelningen i USA i mindre intervaller på 10 000 USD med inkomster större än en viss siffra, vanligtvis en miljon, klumpade samman i ett enda klassintervall.
Använd ditt val när du beräknar klassintervall. Den heliga gralen för ett diagram som ett histogram är att förmedla relevant information på ett meningsfullt och enkelt sätt. Välj dina klassintervall för att förmedla den information som du anser värd läsarnas uppmärksamhet.