• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Andra
    Fördelarna och nackdelarna med en multipel regressionsmodell

    Multipel regression används för att undersöka förhållandet mellan flera oberoende variabler och en beroende variabel. Medan flera regressionsmodeller tillåter dig att analysera den relativa påverkan av dessa oberoende, eller förutsägare, variabler på beroende eller kriterium, variabel, kan dessa ofta komplexa datamängder leda till falska slutsatser om de inte analyseras korrekt.
    Exempel of Multiple Regression -

    En fastighetsmäklare kan använda multipel regression för att analysera värdet på hus. Till exempel kunde hon använda som oberoende variabler husens storlek, deras åldrar, antalet sovrum, det genomsnittliga hempriset i grannskapet och närheten till skolor. Plottning av dessa i en multipel regressionsmodell, hon kunde sedan använda dessa faktorer för att se deras förhållande till priserna på husen som kriterievariabel.

    Ett annat exempel på att använda en multipel regressionsmodell kan vara någon i mänskliga resurser som bestämmer lönen för ledande befattningar - kriteriets variabel. Prediktorvariablerna kan vara varje chefs senioritet, det genomsnittliga antalet arbetade timmar, antalet personer som hanteras och chefens avdelningsbudget.
    Fördelar med multipel regression -

    Det finns två huvudfördelar med att analysera data med hjälp av en multipel regressionsmodell. Den första är förmågan att bestämma det relativa inflytandet av en eller flera prediktorvariabler till kriterievärdet. Fastighetsmäklaren kunde upptäcka att storleken på bostäderna och antalet sovrum har en stark korrelation till priset på ett hem, medan närheten till skolor inte har någon korrelation alls, eller till och med en negativ korrelation om det främst är en pension community.

    Den andra fördelen är förmågan att identifiera outliers eller avvikelser. Till exempel, medan man granskade data relaterade till ledarlöner, kunde personalchefen konstatera att antalet arbetade timmar, avdelningsstorleken och dess budget alla hade en stark korrelation till löner, medan senioriteten inte gjorde det. Alternativt kan det vara så att alla listade prediktorvärden korrelerades med vart och ett av de löner som undersöktes, med undantag för en chef som betalades för högt jämfört med de andra.
    Nackdelar med multipel regression -

    Någon nackdel att använda en multipel regressionsmodell kommer vanligtvis ner på de data som används. Två exempel på detta använder ofullständiga uppgifter och drar falskt slutsatsen att en korrelation är en orsakssamband.

    När man granskade priset på hem, till exempel, antar att fastighetsmäklaren tittade på bara 10 bostäder, varav sju köptes av unga föräldrar. I det här fallet kan förhållandet mellan skolans närhet leda till att hon tror att detta påverkade försäljningspriset för alla bostäder som säljs i samhället. Detta illustrerar fallgroparna med ofullständiga data. Hade hon använt ett större prov kunde hon ha upptäckt att endast 100 procent av hemvärdena var relaterade till en skolas närhet, av 100 sålda bostäder. Om hon hade använt köparnas åldrar som ett prediktorvärde, kunde hon ha upptäckt att yngre köpare var villiga att betala mer för hem i samhället än äldre köpare.

    I exemplet med ledarlöner, anta att det var en outlier som hade en mindre budget, mindre anställning och med färre personal att hantera men gjorde mer än någon annan. HR-chefen kunde titta på uppgifterna och dra slutsatsen att den här personen betalas för mycket. Denna slutsats skulle emellertid vara felaktig om han inte beaktade att denna chef var ansvarig för företagets webbplats och hade ett mycket eftertraktat kunnande inom nätverkssäkerhet.

    © Vetenskap https://sv.scienceaq.com