Hierarkisk regression är en statistisk metod för att utforska relationerna mellan och testa hypoteser om, en beroende variabel och flera oberoende variabler. Linjär regression kräver en numerisk beroende variabel. De oberoende variablerna kan vara numeriska eller kategoriska. Hierarkisk regression innebär att de oberoende variablerna inte matas in i regressionen samtidigt, men i steg. Exempelvis kan en hierarkisk regression undersöka relationerna mellan depression (mätt med viss numerisk skala) och variabler inklusive demografi (som ålder, kön och etnisk grupp) i första etappen och andra variabler (t.ex. poäng på andra test) i en andra etapp.
Tolk regressionens första steg.
Titta på den obestämda regressionskoefficienten (som kan kallas B på din utgång) för varje oberoende variabel. För kontinuerliga oberoende variabler representerar detta förändringen i den beroende variabeln för varje enhetsändring i den oberoende variabeln. I exemplet, om ålder hade en regressionskoefficient på 2,1, skulle det innebära att det förutspådda värdet av depression ökar med 2,1 enheter för varje år.
För kategoriska variabler bör utgången visa en regressionskoefficient för varje nivå av variabeln utom en; Den som saknas kallas referensnivån. Varje koefficient representerar skillnaden mellan den nivån och referensnivån på den beroende variabeln. I exemplet, om referens etnisk grupp är "Vit" och den obestämda koefficienten för "Svart" är -1,2, skulle det innebära att det förutspådda värdet av depression för svarta är 1,2 enheter lägre än för vita.
Titta på de standardiserade koefficienterna (som kan märkas med det grekiska brevet beta). Dessa kan tolkas på samma sätt som de obestämda koefficienterna, bara de är nu i form av standardavvikelseenheter för den oberoende variabeln, i stället för råa enheter. Detta kan hjälpa till att jämföra de oberoende variablerna med varandra.
Titta på signifikansnivåerna eller p-värdena för varje koefficient (dessa kan vara märkta "Pr >" eller något liknande). Dessa berättar om den associerade variabeln är statistiskt signifikant. Detta har en mycket speciell innebörd som ofta är förvrängd. Det betyder att en koefficient som är hög eller högre i ett urval av denna storlek skulle osannolikt inträffa om den verkliga koefficienten, i hela befolkningen från vilken den här ritades, var 0.
Titta på R-kvadraten. Detta visar vilken andel av variationen i den beroende variabeln som beräknas av modellen.
Tolk senare stegen av regressionen, ändringen och det övergripande resultatet
Upprepa ovanstående för varje senare regressionsstadiet.
Jämför de standardiserade koefficienterna, obestämda koefficienter, signifikansnivåer och r-squareds i varje steg till föregående steg. Dessa kan vara i separata delar av produktionen eller i separata kolumner i en tabell. Denna jämförelse låter dig veta hur variablerna i det andra (eller senare) scenet påverkar förhållandet i första etappen.
Titta på hela modellen, inklusive alla steg. Titta på de obestämda och standardiserade koefficienterna och signifikansnivåerna för varje variabel och R-kvadraten för hela modellen.
Varning
Detta är ett mycket komplext ämne.