Bias är felet i uppskattningar på grund av systematiska misstag som leder till konsekvent höga eller låga resultat jämfört med de faktiska värdena. Den individuella förspänningen i en uppskattning som är känd för att vara partisk är skillnaden mellan de uppskattade och faktiska värdena. Om det inte är känt att uppskattningen är partisk kan skillnaden också bero på slumpmässiga fel eller andra felaktigheter. Till skillnad från partiskhet, som alltid verkar i en riktning, kan dessa fel vara positiva eller negativa.
För att beräkna förspänningen för en metod som används för många uppskattningar, hitta felen genom att subtrahera varje uppskattning från det faktiska eller observerade värdet . Lägg till alla fel och dela med antalet uppskattningar för att få förspänningen. Om felen lägger till noll, var uppskattningarna opartiska och metoden ger opartiska resultat. Om uppskattningarna är partiska kan det vara möjligt att hitta källan till förspänningen och eliminera den för att förbättra metoden.
TL; DR (för lång; har inte läst)
Beräkna förspänning genom att hitta skillnaden mellan en uppskattning och det verkliga värdet. För att hitta en metods förspänning, utför många uppskattningar och lägg upp felen i varje uppskattning jämfört med det verkliga värdet. Att dividera med antalet uppskattningar ger metodens förspänning. I statistik kan det finnas många uppskattningar för att hitta ett enda värde. Bias är skillnaden mellan medelvärdet av dessa uppskattningar och det verkliga värdet.
Hur Bias fungerar
När uppskattningar är partiska är de konsekvent fel i en riktning på grund av misstag i systemet som används för uppskattningarna. Till exempel kan en väderprognos konsekvent förutsäga temperaturer som är högre än de som faktiskt observerats. Prognosen är partisk, och någonstans i systemet finns det ett misstag som ger för hög uppskattning. Om prognosmetoden är opartisk kan den fortfarande förutsäga temperaturer som inte är korrekta, men de felaktiga temperaturerna kommer ibland att vara högre och ibland lägre än de observerade temperaturerna.
Statistisk bias fungerar på samma sätt men baseras vanligtvis på ett stort antal uppskattningar, undersökningar eller prognoser. Dessa resultat kan grafiskt representeras i en distributionskurva och förspänningen är skillnaden mellan medelvärdet för fördelningen och det verkliga värdet. Om det finns förspänning kommer det alltid att finnas en skillnad även om vissa enskilda uppskattningar kan falla på båda sidor av det verkliga värdet.
Bias in Surveys.
Ett exempel på förspänning är ett undersökningsföretag som genomför opinionsundersökningar under valet kampanjer, men deras omröstningsresultat överskattar konsekvent resultaten för ett politiskt parti jämfört med verkliga valresultat. Förspänningen kan beräknas för varje val genom att subtrahera det verkliga resultatet från förutsägelsen. Den genomsnittliga förspänningen för den använda enkätmetoden kan beräknas genom att hitta genomsnittet av de enskilda felen. Om förspänningen är stor och konsekvent kan röstningsföretaget försöka ta reda på varför deras metod är partisk.
Bias kan komma från två huvudkällor. Antingen är valet av deltagare för undersökningen partiskt, eller så är partiskhet resultatet av tolkningen av informationen från deltagarna. Exempelvis är enkäter på internet inriktade på grund av att deltagarna i undersökningen som fyller i webbformulärerna inte är representativa för hela befolkningen. Det här är en urvalsförskjutning.
Frågeställningsföretag känner till denna urvalsförskjutning och kompenserar genom att justera siffrorna. Om resultaten fortfarande är partiska är det en informationsbias eftersom företagen inte tolkade informationen korrekt. I alla dessa fall visar en biasberäkning i vilken utsträckning de uppskattade värdena är användbara och när metoderna behöver justeras.