Att hitta styrkan i sambandet mellan två variabler är en viktig färdighet för forskare av alla slag. Om två variabler är korrelerade med varandra visar det att det finns en länk mellan dem. En positiv korrelation innebär att när en variabel ökar gör den andra också, och en negativ korrelation innebär att när en variabel ökar, minskar den andra. Korrelationerna är inte orsakssamband, även om det är möjligt att ytterligare tester kommer att visa sig orsakssamband mellan variablerna. Korrelationskoefficienten R visar styrkan i förhållandet mellan de två variablerna och om det är en positiv eller en negativ korrelation.
TL; DR (för länge, inte läst)
Ring en variabel x och en variabel y. Beräkna värdet på R med formeln:
R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2- (Σx) 2] [ ,null,null,3],n Σy 2- (Σy) 2]} Där n är din samplingsstorlek. Gör en tabell över dina data Skapa ett bord av dina data. Detta bör innehålla en kolumn för deltagarnummeret, en kolumn för den första variabeln (märkt x) och en kolumn för den andra variabeln (märkt y). Om du till exempel ser om det finns en korrelation mellan höjd och skostorlek, skulle en kolumn identifiera varje person du mäter, en kolumn skulle visa varje persons höjd och en annan skulle visa sin storlek på sko. Gör ytterligare tre kolumner, en för xy, en för x 2 och en för y 2. Beräkna värdena för de tomma kolumnerna Använd dina data för att fylla i de tre ytterligare kolumnerna. Tänk dig att din första person mäter 75 inches lång och har storlek 12 fot. Kolumnen x (höjd) skulle visa 75 och kolonnen y (skostorlek) skulle visa 12. Du måste hitta xy, x 2 och y 2. Så använder du detta exempel: xy = 75 × 12 = 900 x 2 = 75 2 = 5,625 y 2 = 12 2 = 144 Fyll i dessa beräkningar för varje person för vilken du har data. Hitta summan av varje kolumn Skapa en ny rad längst ner på ditt bord för summan av varje kolumn. Lägg till alla x-värdena, alla y-värdena, alla xy-värdena, alla x 2-värdena och alla y 2-värdena och lägg sedan resultaten längst ner på motsvarande kolumn i din nya rad. Du kan märka din nya rad "summa" eller använda en sigma (Σ) -symbol. Beräkna R Med formelformeln Du hittar R från dina data med formeln: R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2- (Σx) 2] [nΣy 2- (Σy) 2]} Det ser lite skrämmande ut, så du kan dela upp det i två delar, som vi ringer till s och t. s = n (Σxy) - (Σx) (Σy) t = √ {[n Σx 2- (Σx) 2] [n Σy 2- (Σy) 2]} I dessa ekvationer, n är antalet deltagare du har (din urvalsstorlek). Resten av ekvationsdelarna är summan du beräknade i det sista steget. Så för s multiplicera du storleken på ditt prov med summan av xy-kolumnen och subtrahera sedan summan av x-kolumnen multiplicerad med summan av y-kolumnen från detta. För t finns det fyra huvudsteg. Först beräknar du n multiplicerat med summan av din x 2 kolumn och subtraherar summan av din x-kolumn kvadrerad (multiplicerad med sig) från detta värde. För det andra gör du exakt samma sak men med summan av y 2 kolumnen och summan av y-kolumnen kvadreras i stället för x-delarna (dvs n × Σy 2 - [Σy × Σy]) . Tredje, multiplicera dessa två resultat (för xs och ys) tillsammans. Fjärde, ta kvadratroten av det här svaret. Om du har arbetat i delar kan du beräkna R som bara R = s ÷ t. Du kommer att få ett svar mellan -1 och 1. Ett positivt svar visar en positiv korrelation, med allt över 0,7 anses allmänt vara ett starkt förhållande. Ett negativt svar visar en negativ korrelation, med allt över -0,7 anses vara ett starkt negativt förhållande. Likaså ± 0,5 anses vara ett måttligt förhållande och ± 0,3 anses vara en svag relation. Något nära 0 visar brist på korrelation.