Av Ariel Balter, Ph.D. Uppdaterad 30 augusti 2022
DragonImages/iStock/Getty Images
I regressionsanalys betecknar vi en variabel som förklaringsvariabel (x) och den andra som svarsvariabel (y). Regressionsmodellen ger en funktion y =f(x) som bäst förutsäger y från x. För varje observation i är residualen skillnaden mellan det observerade svaret y[i] och dess förutsagda värde f(x[i]):
Resterande =y[i] – f(x[i])
Betrakta fem individer med följande längd (cm) och vikt (kg) par:(152, 54), (165, 65), (175, 100), (170, 80) och (140, 45). En kvadratisk passform för vikt som funktion av höjd ger ekvationen:
w =f(h) =1160 – 15,5h + 0,054h²
Med denna modell är resterna (i kilogram) [2,38, 7,65, 1,25, 5,60, 3,40]. Summan av rester är 15,5 kg.
Den enklaste regressionsmodellen är linjär, representerad av y =m x + b. Genom konstruktion är summan av residualer för en linjär regression noll, eftersom linjen är anpassad för att minimera den totala vertikala avvikelsen.