I matematiska termer är ett "medelvärde" ett medelvärde. Medelvärdena beräknas för att representera en datamängd meningsfullt. En meteorolog kan till exempel berätta att den genomsnittliga temperaturen för 22 januari i Chicago är 25 grader F baserat på tidigare data. Detta nummer kan inte förutsäga exakt temperaturen för nästa 22 januari i Chicago, men det berättar tillräckligt för att veta att du ska packa en jacka om du ska till Chicago på det datumet. Två vanliga medel är det aritmetiska medelvärdet och det geometriska medelvärdet. Att veta vilken som ska användas för dina data innebär att de förstår deras skillnader.
Formler för beräkning
Den tydligaste skillnaden mellan det aritmetiska medelvärdet och det geometriska medelvärdet för en dataset är hur de beräknas. Det aritmetiska medelvärdet beräknas genom att lägga upp alla siffror i en dataset och dela resultatet med det totala antalet datapunkter.
Exempel: Aritmetisk medelvärde av 11, 13, 17 och 1000 = (11 + 13 + 17 + 1000) /4 = 260,25
Den geometriska medelvärdet för en dataset beräknas genom att multiplicera siffrorna i datasatsen och ta den n: a roten av resultatet, där "n" är det totala antalet av datapunkter i uppsättningen.
Exempel: Geometrisk medelvärde av 11, 13, 17 och 1000 = 4: e rot av (11 x 13 x 17 x 1000) = 39,5
Effekten av utjämnare
När du tittar på resultaten från aritmetiska medelvärden och geometriska medelvärden beräknar du att effekten av utjämnare är kraftigt dämpad i det geometriska medelvärdet. Vad betyder det här? I datasetet 11, 13, 17 och 1000 kallas numret 1000 som "outlier" eftersom dess värde är mycket högre än alla andra. När det aritmetiska medelvärdet beräknas, är resultatet 260.25. Observera att inget tal i datasatsen är jämnt nära 260,25, så det aritmetiska medelvärdet är inte representativt i det här fallet. Outlierens effekt har överdrivits. Det geometriska medelvärdet vid 39,5 gör ett bättre jobb att visa att de flesta siffrorna från datasatsen ligger inom 0 till 50-serien.
Användar
Statistiker använder aritmetiska medel för att representera data utan några betydande outliers. Denna typ av medel är bra för att representera genomsnittliga temperaturer, eftersom alla temperaturer för 22 januari i Chicago kommer att ligga mellan -50 och 50 grader F. En temperatur på 10 000 grader F kommer bara inte att hända. Saker som batting medelvärden och genomsnittliga racerbil hastigheter är också representerade väl med hjälp av aritmetiska medel.
Geometriska medel används i fall där skillnaderna mellan datapunkter är logaritmiska eller varierar med multiplar av 10. Biologer använder geometriska medel för att beskriva storlekarna av bakteriepopulationer, som kan vara 20 organismer en dag och 20 000 nästa. Ekonomer kan använda geometriska medel för att beskriva inkomstfördelningar. Du och de flesta av dina grannar kan göra omkring 65 000 dollar per år, men vad händer om killen uppe på kullen gör 65 miljoner dollar per år? Det aritmetiska medelvärdet av inkomsten i ditt grannskap skulle vara vilseledande här, så ett geometriskt medelvärde skulle vara mer lämpligt.