Korrelationen mellan två variabler beskriver sannolikheten för att en ändring i en variabel kommer att orsaka en proportionell förändring i den andra variabeln. En hög korrelation mellan två variabler tyder på att de delar en gemensam orsak eller att en ändring i en av variablerna är direkt ansvarig för en förändring i den andra variabeln. Pearsons r-värde används för att kvantifiera korrelationen mellan två diskreta variabler.
Märk variabeln som du tror orsakar ändringen till den andra variabeln som x (den oberoende variabeln) och den andra variabeln y (den beroende variabeln ).
Konstruera en tabell med fem kolumner och så många rader som det finns datapunkter för x och y. Märk kolumnerna A till och med E från vänster till höger.
Fyll i varje rad med följande värden för varje (x, y) datapunkt i den första kolumnen - värdet av x i kolumn A, värdet av x kvadrerad i kolumn B, värdet på y i kolumn C, värdet på y kvadrerat i kolumn D och värdet x gånger y i kolumn E.
Gör en sista raden längst ner på bordet och summera alla värden för varje kolumn i sin motsvarande cell.
Beräkna produkten av de slutliga cellerna i kolumn A och C.
Multiplicera den slutliga cellen i kolumn E av antal datapunkter.
Dra det värde som erhållits i steg 5 från värdet som erhållits i steg 6 och underlätta svaret.
Multiplicera den sista cellen i kolumn B med antalet datapunkter. Subtrahera värdet av den slutliga cellen i kolumn A från det här värdet.
Multiplicera den sista cellen i kolumn D med antalet datapunkter och subtrahera kvadraten av värdet för den slutliga cellen i kolumn C .
Multiplicera värdena som hittades i steg 8 och 9 tillsammans och ta sedan kvadratroten av resultatet.
Dela upp värdet som erhållits i steg 7 (det ska understrykas) med det erhållna värdet i steg 10. Detta är Pearson's r, även känd som korrelationskoefficienten. Om r ligger nära 1, är det en stark positiv korrelation. Om r ligger nära -1 är det en stark negativ korrelation. Om r är nära 0, är det en svag korrelation.