När du bygger modeller i statistik testar du vanligtvis dem och ser till att modellerna matchar verkliga situationer. Resten är ett tal som hjälper dig att bestämma hur nära din teoretiska modell är för fenomenet i den verkliga världen. Residualer är inte för svåra att förstå: De är bara siffror som representerar hur långt bort en datapunkt är från vad den ska "vara enligt den förutspådda modellen." Matematisk definition
Matematiskt är en rest skillnaden mellan en observerad datapunkt och det förväntade eller beräknade värdet för vad den datapunkten borde ha varit. Formeln för en rest är R = O - E, där "O" betyder det observerade värdet och "E" betyder det förväntade värdet. Detta betyder att positiva värden på R visar värden högre än förväntat, medan negativa värden visar värden lägre än förväntat. Till exempel kan du ha en statistisk modell som säger när en mans vikt är 140 pund, hans höjd ska vara 6 fot eller 72 tum. När du går ut och samlar in data kan du hitta någon som väger 140 pund men är 5 fot 9 tum eller 69 tum. Resten är sedan 69 tum minus 72 tum, vilket ger dig ett värde av negativa 3 tum. Med andra ord är den observerade datapunkten 3 tum under det förväntade värdet.
Kontrollera modeller
Residualer är särskilt användbara när du vill kontrollera om din teoretiska modell fungerar i den verkliga världen. När du skapar en modell och beräknar dess förväntade värden, är du teoretisk. Men när du hämtar data kan du konstatera att data inte matchar modellen. Ett sätt att hitta denna ojämlikhet mellan din modell och den verkliga världen är att beräkna rester. Om du till exempel upptäcker att dina rester är alla konsekvent långt ifrån dina uppskattade värden, kanske din modell inte har en stark underliggande teori. Ett enkelt sätt att använda resurser på detta sätt är att plotta dem.
Sciencing Video Vault
Skapa (nästan) perfekt fäste: Här är hur
Skapa den (nästan) perfekta fästet: Här är hur
plotting Residualer
När du beräknar resterna, har du en handfull siffror, vilket är svårt för människor att tolka. Att plotta resterna kan ofta visa mönster. Dessa mönster kan leda dig att avgöra om modellen passar bra. Två aspekter av rester kan hjälpa dig att analysera en tomt av rester. Först ska rester för en bra modell sprids på båda sidor av noll. Det vill säga, en plot av rester skulle ha ungefär samma mängd negativa rester som positiva rester. För det andra ska rester förefalla vara slumpmässiga. Om du ser ett mönster i din återstående plot, t.ex. dem som har ett tydligt linjärt eller böjt mönster, kan din ursprungliga modell ha ett fel.
Specialrester: Outliers
Outliers eller rester av extremt stora värden , förefaller ovanligt långt borta från de andra punkterna på din plot av rester. När du hittar en rest som är en outlier i din dataset, måste du noga tänka på det. Vissa forskare rekommenderar att avvikelser elimineras eftersom de är "anomalier" eller speciella fall. Andra rekommenderar ytterligare utredning om varför du har så stor rest. Till exempel kan du göra en modell av hur stress påverkar skolkvaliteter och teoretisera att mer stress betyder vanligtvis sämre betyg. Om dina data visar att detta är sant utom för en person, som har mycket låg stress och mycket låga betyg, kanske du frågar dig varför. En sådan person kan helt enkelt inte bryr sig om någonting, inklusive skolan, förklarar den stora kvarlevan. I det här fallet kan du överväga att ta resten av din dataset eftersom du bara vill modellera studenter som bryr sig om skolan.