Ett spridningsdiagram är ett diagram som visar förhållandet mellan två uppsättningar data. Ibland är det bra att använda data som finns i ett scatterplot för att få ett matematiskt förhållande mellan två variabler. Ekvationen för en scatterplot kan erhållas manuellt med hjälp av två huvudvägar: en grafisk teknik eller en teknik som kallas linjär regression.
Skapa en scatterplot
Använd grafpapper för att skapa en scatterplot. Rita x- och y-axlarna, se till att de skär och märker uppkomsten. Se till att x- och y-axlarna också har rätt titlar. Därefter plottar varje datapunkt i grafen. Eventuella trender mellan de plottade datasætten borde nu vara uppenbara.
Bästa anpassningsrad
När en scatterplot har skapats, förutsatt att det finns en linjär korrelation mellan två datasatser, kan vi använda en grafisk metod för att erhålla ekvationen. Ta linjal och dra en linje så nära som möjligt till alla punkter. Försök att se till att det finns så många poäng ovanför linjen som det finns under linjen. När linjen har ritats, använd standardmetoder för att hitta ekvationen för den raka linjen
Equation of Straight Line
När en linje med bästa passform har placerats på en scatterdiagram är det rakt för att hitta ekvationen. Den allmänna ekvationen för en rak linje är:
y = mx + c
Där m är lutningen (gradient) av linjen och c är y-avsnitten. För att få gradienten, hitta två punkter på linjen. För det här exemplets skull, anta att de två punkterna är (1,3) och (0,1). Graden kan beräknas med skillnaden i y-koordinaterna och divideras med skillnaden i x-koordinaterna:
m = (3 - 1) /(1 - 0) = 2/1 = 2
Graden i det här fallet är lika med 2. Hittills är ligningens rakning
y = 2x + c
Värdet för c kan erhållas genom att ersätta värdena för en känd punkt. Efter exemplet är en av de kända punkterna (1,3). Anslut detta till ekvationen och omordna för c:
3 = (2 * 1) + c
c = 3 - 2 = 1
Den sista ekvationen i det här fallet är:
y = 2x + 1
Linjär regression
Linjär regression är en matematisk metod som kan användas för att erhålla linjär ekvation för en scatterplot. Börja med att placera dina data i en tabell. För det här exemplet, låt oss anta att vi har följande data:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Beräkna summan av x-värdena:
x_sum = 4,1 + 6,5 + 12,6 = 23,2
Beräkna summan av y-värdena:
y_sum = 2,2 + 4,4 + 10,4 = 17
Summa nu produkterna i varje datapunktsuppsättning:
xy_sum = (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) = 168.66
Nästa, beräkna summan av x-värdena kvadrerade och y-värdena kvadrerade:
x_square_sum = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82
y_square_sum = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25
Slutligen räkna antalet datapunkter du har. I det här fallet har vi tre datapunkter (N = 3). Graden för den bästa passformen kan erhållas från:
m = (N * xy_sum) - (x_sum * y_sum) /(N * x_square_sum) - (x_sum * x_sum) = (3 * 168,66) - (23.2 * 17) /(3 * 217.82) - (23.2 * 23.2) = 0.968
Avsnittet för den bästa passformen kan erhållas från:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) /(N * x_square_sum) - (x_sum * x_sum)
\\ = (217,82 17) - (23,2-1 168,66) /(3 * 217,82) - (23,2 * 23,2) \\ = -1,82 Slutlig ekvation är därför: y = 0,968x - 1,82