Minst kvadrera regressionslinjen (LSRL) är en linje som fungerar som en prediktionsfunktion för ett fenomen som inte är känt. Den matematiska statistiska definitionen av en minsta kvadratregressionslinje är linjen som passerar genom punkten (0,0) och har en lutning lika med korrelationskoefficienten för data efter det att data har standardiserats. Beräkningen av minsta kvadratregressionslinjen innebär således att man standardiserar data och finner korrelationskoefficienten.
Hitta korrelationskoefficienten
Ordna dina data så att det är lätt att arbeta med. Använd ett kalkylblad eller en matris för att separera dina data i sina x-värden och y-värden, hålla dem länkade (dvs se till att varje datapunkts x-värde och y-värde ligger i samma rad eller kolumn). <
Hitta korsprodukterna av x-värdena och y-värdena. Multiplicera x-värdet och y-värdet för varje punkt tillsammans. Summa dessa resulterande värden. Ring resultatet "sxy".
Summa x-värdena och y-värdena separat. Ring dessa två resulterande värden "sx" respektive "sy".
Räkna antalet datapunkter. Ring detta värde "n."
Ta summan av rutor för dina data. Kvadrera alla dina värden. Multiplicera varje x-värde och varje y-värde av sig själv. Ring de nya uppsättningarna av data "x2" och "y2" för x-värdena och y-värdena. Summa alla x2-värdena och kalla resultatet "sx2." Summa alla y2-värdena och kalla resultatet "sy2."
Subtrahera sx * sy /n från sxy. Ring resultatet "num."
Beräkna värdet sx2- (sx ^ 2) /n. Ring resultatet "A."
Beräkna värdet sy2- (sy ^ 2) /n. Ring resultatet "B."
Ta kvadratroten av A gånger B, som kan visas som (A * B) ^ (1/2). Märk resultatet "denom."
Beräkna korrelationskoefficienten, "r." Värdet på "r" är lika med "num" dividerat med "denom" som kan skrivas som num /denom.
Standardisera data och skriv LSRL
Hitta medelvärdena för x-värdena och y-värdena. Lägg till alla x-värdena tillsammans och dela resultatet med "n." Ring detta "mx." Gör detsamma för y-värdena, kalla resultatet "my."
Hitta standardavvikelserna för x-värdena och y-värdena. Skapa nya datasatser för x och y genom att subtrahera medelvärdet för varje dataset från dess associerade data. Till exempel blir varje datapunkt för x, "xdat" "xdat - mx." Ruta de resulterande datapunkterna. Lägg till resultaten för varje grupp (x och y) separat, dividerar med "n" för varje grupp. Ta kvadratroten av dessa två slutresultat för att ge standardavvikelsen för varje grupp. Ring standardavvikelsen för x-värdena "sdx" och den för y-värdena "sdy."
Standardisera data. Subtrahera medelvärdet för x-värdena från varje x-värde. Dela resultaten med "sdx". Återstående data är standardiserade. Ring denna data "x_". Gör detsamma för y-värdena: subtrahera "min" från varje y-värde, dela med "sdy" när du går vidare. Ringa upp dessa data "y_".
Skriv regressionsraden. Skriv "y_ ^ = rx_", där "^" är representativt för "hatt" - ett förutsagt värde - och "r" är lika med korrelationskoefficienten som hittades tidigare.