En scatterplot är ett viktigt diagnostiskt verktyg i en statistikerens arsenal, erhållen genom att man graderar två variabler mot varandra. Det gör det möjligt för statistikern att eyeballa variablerna och bilda en arbetshypotes om deras relation. Av denna anledning ritas det vanligen innan en regressionsanalys utförs. Statistiker testar därefter hypotesen med hjälp av en regressionsanalys och bestämmer tecknet och exakt storleken på förhållandet. Vidare hjälper en scatterplot att identifiera avvikande värden - värden som är onormalt avlägsna från de flesta data i provet. Att eliminera utelämnare bidrar till att förbättra regressionsmodellen.
Kontrollera negativ relation mellan de två variablerna i scatterplot. Om låga värden för den första variabeln motsvarar höga värden för den andra variabeln, är det en negativ korrelation. I det här fallet har en linje som dras genom datapunkterna en negativ lutning.
Undersök scatterplot för positivt samband mellan variablerna. Om låga värden för den första variabeln i scatterplot motsvarar låga värden för den andra, och de höga värdena för den första motsvarar motsvarande de höga värdena i den andra har variablerna en positiv korrelation. I det här fallet har en linje som dras genom datapunkterna en positiv lutning.
Kontrollera spridningsdiagrammet för ingen relation mellan variablerna. Om datapunkterna i scatterplot distribueras slumpmässigt utan uppenbart förhållande mellan de två, har de varken någon korrelation eller liten, statistiskt obetydlig korrelation. I det här fallet är en linje som dras genom datapunkterna horisontell med lutning lika med noll.
Anpassa en linje genom datapunkterna och granska dess form för att mäta karaktären av förhållandet mellan de två variablerna. En rät linje tolkas som ett linjärt förhållande, en krökt form föreslår ett kvadratisk förhållande och en linje som ligger relativt platt innan plötsligt skjutas upp eller ner tolkas som ett exponentiellt förhållande.
Undersök spridningsdiagrammet för outliers , värden som ligger onormalt långt ifrån kluster av datapunkter. Outliers förvränger förhållandet mellan variablerna. Eliminera dem, men bara om deras frånvaro inte påverkar analysen av förhållandet mellan de två variablerna.