Multipel regression används för att undersöka förhållandet mellan flera oberoende variabler och en beroende variabel. Medan flera regressionsmodeller tillåter dig att analysera de relativa influenserna av dessa oberoende eller prediktorer, variabler i variabeln beroende eller kriterium, kan dessa ofta komplexa datamängder leda till falska slutsatser om de inte analyseras korrekt.
< h2> Exempel på multipel regression
En fastighetsmäklare kan använda flera regressioner för att analysera värdet på husen. Till exempel kan hon använda som oberoende variabler storleken på husen, deras åldrar, antalet sovrum, det genomsnittliga bostadspriset i grannskapet och närheten till skolorna. Plottar dessa i en multipelregressionsmodell kan hon sedan använda dessa faktorer för att se deras förhållande till bostadspriserna som kriterievariabel.
Ett annat exempel på att använda en multipelregressionsmodell kan vara någon i personalresurser Lön för ledande befattningar - kriterievariabeln. Prediktorvariablerna kan vara varje chefs senioritet, det genomsnittliga antalet arbetade timmar, antalet personer som hanteras och chefsavdelningen.
Fördelar med multipel regression
Det finns två stora fördelar med att analysera data med hjälp av en multipelregressionsmodell. Den första är förmågan att bestämma det relativa inflytandet av en eller flera prediktorvariabler till kriterievärdet. Fastighetsmäklare kan konstatera att storleken på bostäderna och antalet sovrum har en stark korrelation med priset på ett hem, medan närheten till skolor inte har någon korrelation alls eller till och med en negativ korrelation om det i första hand är pensionering gemenskap.
Den andra fördelen är förmågan att identifiera avvikare eller avvikelser. När man till exempel granskade uppgifterna om förvaltningslöner kunde personalchefen konstatera att antalet arbetade timmar, avdelningsstorleken och dess budget alla hade en stark korrelation med lönerna, medan anställning inte gjorde det. Alternativt kan det vara att alla de listade prediktorvärdena korrelerades med var och en av de löner som undersöktes, förutom en chef som överbetalades i jämförelse med de andra.
Nackdelar med multipel regression
Eventuella nackdelar med att använda en multipelregressionsmodell kommer vanligen ner till de data som används. Två exempel på detta använder ofullständiga data och felaktigt slår fast att en korrelation är ett orsak.
När du prissätter bostadspriset, t ex, anta att fastighetsmäklaren tittade på endast 10 bostäder, varav sju var inköpta av unga föräldrar. I det här fallet kan förhållandet mellan skolans närhet leda henne att tro att det här påverkar försäljningspriset för att alla bostäder säljs i samhället. Detta illustrerar fallgroparna av ofullständiga data. Om hon hade använt ett större urval kunde hon ha funnit att utav 100 bostäder sålda var bara tio procent av hemvärdena relaterade till skolans närhet. Om hon hade använt köparens åldrar som ett prediktionsvärde kunde hon ha funnit att yngre köpare var villiga att betala mer för bostäder i samhället än äldre köpare.
I lönegodsens exempel, anta att det fanns en outlier som hade en mindre budget, mindre anställning och med färre personal att hantera men gjorde mer än någon annan. HR-chefen kunde titta på uppgifterna och konstatera att den här personen är överbetald. Denna slutsats skulle emellertid vara felaktig om han inte tog hänsyn till att denna chef hade ansvaret för företagets hemsida och hade en mycket eftertraktad kompetens inom nätverkssäkerhet.