Vid en eller annan tid har du antagligen använt kalkylarksprogram för att hitta den bästa linjära ekvationen som passar en given uppsättning datapunkter - en operation som kallas enkel linjär regression. Om du någonsin har undrat exakt hur kalkylbladsprogrammet slutför beräkningen, oroa dig inte, det är inte magiskt. Du kan faktiskt hitta raden som passar dig bäst utan ett kalkylprogram genom att bara koppla in siffror med din räknare. Tyvärr är formeln komplicerad, men den kan delas upp i enkla och hanterbara steg.
Förbered data
Kompilera dina data i en tabell. Skriv x-värdena i en kolumn och y-värden i en annan. Bestäm hur många rader, t ex hur många datapunkter eller x, y-värden du har i din tabell.
Lägg till ytterligare två kolumner i tabellen. Anger en kolumn som "x kvadrerad" och den andra som "xy" för x gånger y.
Fyll i x-kvadrerade kolumnen genom att multiplicera varje värde av x gånger själv eller kvadrera den. Till exempel är 2 kvadrat 4, eftersom 2 x 2 = 4.
Fyll i xy kolumnen genom att multiplicera varje värde av x mot motsvarande värde av y. Om x är 10 och y är 3, då 10 x 3 = 30.
Lägg upp alla siffror i x-kolumnen och skriv summan ner längst ner i x-kolumnen. Gör detsamma för de andra tre kolumnerna. Du kommer nu använda dessa summor för att hitta en linjär funktion av formen y = Mx + B, där M och B är konstanter.
Hitta M
Multiplicera antalet punkter i din dataset genom summan av xy-kolumnen. Om summan av xy-kolumnen är 200, till exempel, och antalet datapunkter är 10, skulle resultatet vara 2000.
Multiplicera summan av x-kolumnen med summan av y-kolumnen. Om summan av x-kolumnen är 20 och summan av y-kolumnen är 100, skulle ditt svar vara 2000.
Dra resultatet i steg 2 från resultatet i steg 1. I exemplet skulle ditt resultat vara 0.
Multiplicera antalet datapunkter i din dataset med summan av den x-kvadrerade kolumnen. Om ditt antal datapunkter är 10 och summan av din x-kvadrerade kolumn är 60, skulle ditt svar vara 600.
Kvadratera summan av x-kolumnen och subtrahera den från resultatet i steg 4. Om summan av x-kolumnen är 20, 20 kvadrera skulle vara 400, så 600-400 är 200.
Dela ditt resultat från steg 3 med resultatet från steg 5. I exemplet kommer resultatet att vara 0 , eftersom 0 dividerad med vilket tal som helst är 0. M = 0.
Hitta B och Lös ekvationen
Multiplicera summan av x-kvadrerade kolumnen med summan av y-kolumnen. I exemplet är summan av den x-kvadrerade kolumnen 60 och summan av y-kolumnen är 100, så 60 x 100 = 6000.
Multiplicera summan av x-kolumnen med summan av xy kolumn. Om summan av x-kolumnen är 20 och summan av xy-kolumnen är 200 sedan 20 x 200 = 4000.
Dra ditt svar i steg 2 från ditt svar i steg 1: 6000 - 4000 = 2000.
Multiplicera antalet datapunkter i din dataset med summan av den x-kvadrerade kolumnen. Om ditt antal datapunkter är 10 och summan av din x-kvadrerade kolumn är 60, skulle ditt svar vara 600.
Kvadratera summan av x-kolumnen och subtrahera den från resultatet i steg 4. Om summan av x-kolumnen är 20, då 20 kvadrera skulle vara 400, så 600-400 är 200.
Dela ditt resultat från steg 3 med resultatet från steg 5. I det här exemplet skulle 2000/200 var 10, så du vet nu att B är 10.
Skriv ut den linjära ekvationen du har erhållit genom att använda formen y = Mx + B. Anslut de värden du har beräknat för M och B. I exempel, M = 0 och B = 10, så y = 0x + 10 eller y = 10.
Tips
Är du nyfiken på hur den formel du just använde är härledd? Det är egentligen inte så svårt som du kanske tror, men det innebär viss delkalkyl (partiella derivat). Den första länken under avsnittet Referenser ger dig lite insikt om du är intresserad.
Många diagramräknare och kalkylprogram är utformade för att automatiskt beräkna linjära regressionsformler för dig, även om stegen du behöver få din kalkylprogram /grafikräknare för att utföra denna operation beror på modell /varumärke. Läs användarhandboken för instruktioner.
Varning
Observera att den formel du har härstammat är en linje med bästa passform. Det betyder inte att det kommer att gå igenom varje enskild datapunkt - det är faktiskt inte troligt att det kommer att göra det. Det kommer emellertid att vara den bästa möjliga linjära ekvationen för datasatsen du använde.