Av Thomas BourdinUppdaterad 30 augusti 2022
Tevarak/iStock/GettyImages
Linjär regression är en hörnsten i statistisk analys, vilket gör att vi kan uppskatta sambandet mellan en prediktorvariabel x och en svarsvariabel y med hjälp av ekvationen y = mx + b . Även om den anpassade linjen ofta fångar den underliggande trenden, passerar den sällan genom varje datapunkt perfekt. De resulterande avvikelserna – så kallade residualer – introducerar osäkerhet i våra parameteruppskattningar, särskilt lutningen m . Standardfelet för lutningen kvantifierar denna osäkerhet, vilket möjliggör konfidensintervall och hypotestest.
SSR är summan av skillnaderna i kvadrat mellan observerade y värden och de värden som förutspås av den monterade linjen. Till exempel, om de observerade värdena är 2,7, 5,9 och 9,4 och modellen förutsäger 3, 6 och 9, är de kvadratiska residualerna 0,09, 0,01 respektive 0,16. Att lägga till dem ger en SSR på 0,26.
Dividera SSR med frihetsgraderna, vilket är antalet observationer minus två (för lutningen och skärningen). I exemplet, med tre observationer, är divisorn 1, vilket ger en variansuppskattning på 0,26. Kalla detta värde A .
Kvadratroten ur A (√0,26) är lika med 0,51. Detta värde representerar standardavvikelsen för residualerna och kommer att användas i den slutliga beräkningen.
x
ESS mäter variabiliteten för prediktorvariabeln runt dess medelvärde. För x värden på 1, 2 och 3 är medelvärdet 2. Subtrahera medelvärdet och kvadrera varje skillnad ger 1, 0 och 1, vilket summerar till 2. Således är ESS =2.
Kvadratroten av ESS (√2) är 1,41. Beteckna detta som B .
Dividera kvadratroten av variansuppskattningen (steg 3) med kvadratroten av ESS (steg 5):0,51 ÷ 1,41 =0,36. Detta värde—0,36—är standardfelet för lutningen.
För stora datamängder, automatisera beräkningen för att undvika manuella fel och spara tid.