• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Matematik
    Hur man beräknar regressionskoefficienten

    En av de mest grundläggande verktygen för teknisk eller vetenskaplig analys är linjär regression. Denna teknik börjar med en dataset i två variabler. Den oberoende variabeln brukar kallas "x" och den beroende variabeln brukar kallas "y". Målet med tekniken är att identifiera linjen, y = mx + b, som approximerar datasatsen. Denna trendlinje kan visa, grafiskt och numeriskt, relationer mellan de beroende och oberoende variablerna. Från denna regressionsanalys beräknas också ett värde för korrelation.

    Identifiera och separera x- och y-värdena för dina datapunkter. Om du använder ett kalkylblad anger du dem i angränsande kolumner. Det bör finnas samma antal x- och y-värden. Om inte, kommer beräkningen vara felaktig, eller kalkylbladfunktionen kommer att returnera ett fel. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)

    Beräkna medelvärdet för x-värdena och y-värden genom att dividera summan av alla värden med det totala antalet värden i uppsättningen. Dessa medelvärden kommer att kallas "x_avg" och y_avg. "X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) /7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) /7 = 5

    Skapa två nya dataset genom att subtrahera x_avg-värdet från varje x-värde och y_avg-värdet från varje y-värde. X1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6 ...) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5, ... ) y1 = (-3, -2, 4, -4, 3, 2, 0)

    Multiplicera varje x1-värde med varje y1-värde i ordning. x1y1 = (0 * -3, -1 * -2, 5 * 4, ...) x1y1 = (0, 2, 20, -4, -3, -4, 0)

    Kvadrat varje x1 värde. X1 ^ 2 = (0 ^ 2 , 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 = (0, 1, 25, 1, 4, 4)

    Beräkna summan av x1y1-värdena och x1 ^ 2 värden. sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 sum_x1 ^ 2 = 0 + 1 + 25 + 1 + 1 + 4 + 4 = 36

    Dela "sum_x1y1" med " sum_x1 ^ 2 "för att få regressionskoefficienten. sum_x1y1 /sum_x1 ^ 2 = 11/36 = 0,306

    TL; DR (för länge, läste inte)

    För de som föredrar att arbeta direkt med ekvationen, i t är m = summa [(x_i - x_avg)] /summa [(x_i - x_avg) ^ 2.

    Många kalkylblad kommer att ha en rad olika linjära regressionsfunktioner. I Microsoft Excel kan du använda "Slope" -funktionen för att ta medeltalet av x- och y-kolumnerna, och kalkylbladet utförs automatiskt alla resterande beräkningar.

    © Vetenskap https://sv.scienceaq.com