Det starkaste sättet att visa hur två variabler är associerade - som studietid och kurssucces - är korrelationen. Varieringen från +1,0 till -1,0 visar korrelationen exakt hur en variabel förändras som den andra gör.
För vissa forskningsfrågor är en av variablerna kontinuerliga, till exempel hur många timmar en student studerar för en undersökning som kan sträcka sig från 0 till över 90 timmar varje vecka. Den andra variabeln är dikotom, till exempel, passade den här studenten eller inte? I situationer som detta måste du beräkna punkt-biserial korrelation.
Förberedelse
Ordna dina data i en tabell med tre kolumner, antingen på papper eller på ett datakalkylblad: Fallnummer (t.ex. som "Student # 1", "Student # 2" och så vidare), Variable X (som "Total Hours Studied") och Variable Y (som "Passed Exam"). I ett givet fall kommer Variabel Y att vara lika med 1 (den här studenten godkände tentamen) eller 0 (studenten misslyckades). Du kan använda för detta steg.
Ta bort outlier-data. Till exempel, om fyra femtedelar av eleverna studerade mellan 3 och 10 timmar för tentamen, släng ut data från studenter som inte studerade alls eller vem studerade över 20 timmar.
Räkna dina ärenden för att verifiera att du har nog att räkna ut en statistiskt signifikant och tillräckligt kraftfull korrelation. Om du inte har minst 25 till 70 fall är det inte värt att beräkna en korrelation.
Har två olika personer samma datatabell självständigt och se om det finns några skillnader. Lös några avvikelser innan du fortsätter med beräkningarna.
Beräkning
Beräkna medelvärdet av värdena för variabel X där Y = 1. Det är för alla fall där Y = 1 lägger till värdena för variabel X och dela med antalet sådana fall. I vårt exempel är det genomsnittliga totala antal timmar som studerats för studenter som godkänt tentamen. låt oss säga att det är 10.
Beräkna medelvärdet av värdena för variabel X där Y = 0. Det är för alla fall där Y = 0, lägger upp värdena för variabel X och delas med antalet dessa fall. Här är det genomsnittliga antalet timmar som studerats för studenter som misslyckades; låt oss säga att det är 3.
Dra resultatet av steg 2 från steg 1. Här, 10 - 3 = 7.
Multiplicera antalet fall du använde i steg 1 gånger antalet fall du använde i steg 2. Om 40 elever passerade provet och 20 misslyckades, är detta 40 x 20 = 800.
Multiplicera det totala antalet fall med en mindre än det numret. Här tog 60 studenter totalt examen, så den här siffran är 60 x 59 = 3.540.
Dela resultatet från steg 4 och resultatet från steg 5. Här, 800/3540 = 0.226.
Beräkna kvadratroten av resultatet av steg 6, med hjälp av en kalkylator eller ett datarkalkylblad. Här skulle det vara 0,475.
Kvadrata varje värde av variabel X, och lägg upp alla rutor.
Multiplicera resultatet av steg 8 med numret på alla fallen. Här multiplicerar du resultatet av steg 8 med 60.
Lägg upp summan av Variabel X över alla fall. Så, du skulle lägga till alla totala timmar som studerades i hela provet.
Kvadratera resultatet från steg 10.
Dra resultatet av steg 11 från resultatet av steg 9.
Dela resultatet av steg 12 med resultatet av steg 5.
Beräkna kvadratroten av resultatet av steg 13, med hjälp av en kalkylator eller ett datarkalkylblad.
Dela upp resultatet av steg 3 med resultatet av steg 14.
Multiplicera resultatet av steg 15 med resultatet av steg 7. Detta är värdet av punkt-biserial korrelationen.
Tips
Skriv ut alla dessa steg. Skriv ner värdet av varje resultat du får vid varje steg i avsnittet "Beräkna" intill steget.
Beräkna detta en gång, ta en paus och beräkna korrelationen igen. Om du har en allvarlig avvikelse har det varit ett misstag eller två någonstans längs linjen.
Se Cohns "Power Primer" för information om statistiskt signifikant och tillräckligt kraftfull korrelation (se Referenser).
Varning
Ditt resultat måste passa in i intervallet mellan +1.0 och -1.0 inklusive. Värden som +0,45 eller -0,22 är bra. Värden som 16.4 eller -32.6 är matematiskt omöjliga; om du får något såhär har du gjort ett misstag någonstans.
Följ steg 3 exakt. Dra inte ut resultatet av steg 1 från resultatet av steg 2.