Summan av kvadrater är en verktygsstatistik och forskare använder för att utvärdera den övergripande variansen av en dataset från dess medelvärde. En stor summa av kvadrater betecknar en stor varians, vilket innebär att enskilda avläsningar varierar mycket från medelvärdet.
Denna information är användbar i många situationer. Till exempel kan en stor variation i blodtrycksavläsningar över en viss tidsperiod peka på en instabilitet i det kardiovaskulära systemet som behöver medicinsk behandling. För finansiella rådgivare innebär en stor variation i dagliga aktievärden marknadstillstånd och högre risker för investerare. När du tar kvadratroten av summan av kvadrater får du standardavvikelsen, ett ännu mer användbart tal.
Hitta summan av kvadrater
Räkna antalet mätningar
Antalet mätningar är provstorleken. Anteckna det med bokstaven "n."
Beräkna medelvärdet
Medelvärdet är det aritmetiska medelvärdet av alla mätningar. För att hitta det, lägger du till alla mätningar och delas av provstorleken, n.
Subtrahera varje mätning från medelvärdet
Antal större än medelvärdet ger ett negativt tal, men det gör inte det det spelar ingen roll. Detta steg ger en serie av n enskilda avvikelser från medelvärdet.
Kvadrata skillnaden mellan varje mätning från medelvärdet
När du kvadrerar ett tal är resultatet alltid positivt. Du har nu en serie n positiva tal.
Lägg till kvadraterna och dela med (n - 1)
Det här sista steget producerar summan av kvadrater. Du har nu en standardvariant för din samplingsstorlek.
Standardavvikelse
Statistiker och forskare lägger vanligtvis ett steg till att producera ett tal som har samma enheter som var och en av mätningarna. Steget är att ta kvadratroten av summan av kvadrater. Detta tal är standardavvikelsen, och den anger det genomsnittliga beloppet varje mätning avviker från medelvärdet. Nummer utanför standardavvikelsen är antingen ovanligt höga eller ovanligt låga.
Exempel
Antag att du mäter utetemperaturen varje morgon i en vecka för att få en uppfattning om hur mycket temperaturen fluktuerar i ditt område . Du får en serie temperaturer i grader Fahrenheit som ser ut så här:
Mån: 55, tis: 62, ons: 45, tors: 32, fre: 50, lör: 57, sön: 54
För att beräkna medeltemperaturen, lägg till mätningarna och dela med det antal du spelade in, vilket är 7. Du finner medelvärdet att vara 50,7 grader.
Beräkna nu de enskilda avvikelserna från medelvärdet. Denna serie är:
4,3; -11,3; 5,7; 18,7; 0,7; -6,3; - 2.3
Kvadrat varje nummer: 18.49; 127,69; 32,49; 349,69; 0,49; 39,69; 5.29
Lägg till siffrorna och dela med (n - 1) = 6 för att få 95.64. Detta är summan av kvadrater för denna serie mätningar. Standardavvikelsen är kvadratroten av detta nummer, eller 9,78 grader Fahrenheit.
Det är ett ganska stort antal som berättar att temperaturen varierade ganska lite över veckan. Det berättar också att tisdag var ovanligt varm medan torsdagen var ovanligt kall. Du kan nog känna det, men nu har du statistiskt bevis.