En lådaplot, även känd som en låda- och visplock, är en typ av graf som visar en sammanfattning av en stor mängd data i fem siffror. Dessa siffror inkluderar median, övre kvartil, lägre kvartil, minsta och maximala data värden. Liksom med många statistiska grafer, har rutan plotmetoden fördelar och nackdelar.
TL; DR (för länge, läste inte)
Box och whisker plots hanterar stora data utan problem, men de behåll inte de exakta värdena och detaljerna i distributionens resultat. Dessa grafer möjliggör en tydlig sammanfattning av stora mängder data.
Hanterar stora data enkelt
På grund av den femtaliga datasammanfattningen kan en lådplot hantera och presentera en sammanfattning av en stor mängd av data. En lådplot består av medianen, som är mittpunkten för datafältet; de övre och nedre kvartilerna, som representerar siffrorna ovanför och under de högsta och nedre delarna av data och de minsta och maximala datavärdena. Att organisera data i en lådplot genom att använda fem nyckelkoncept är ett effektivt sätt att hantera stora data för omanagliga för andra grafer, till exempel linjekorv eller stam- och bladplottor.
Exakta värden som inte sparas
Lådplotten behåller inte exakta värden och detaljer för distributionsresultatet, vilket är ett problem med hanteringen av så stora mängder data i den här grafiktypen. En ruta visar bara en enkel sammanfattning av fördelningen av resultat så att du snabbt kan se den och jämföra den med andra data. Använd en ruttsplot i kombination med en annan statistisk grafmetod, som ett histogram, för en mer noggrann och mer detaljerad analys av data.
En klar sammanfattning
En lådplot är en högt visuellt effektivt sätt att visa en tydlig sammanfattning av en eller flera uppsättningar data. Det är särskilt användbart för att snabbt summera och jämföra olika uppsättningar resultat från olika experiment. I ett ögonblick tillåter en lådplot en grafisk visning av fördelningen av resultat och ger indikationer på symmetri inom data.
Visar Outliers
En lådplot är en av mycket få statistiska grafmetoder som visar outliers. Det kan finnas en outlier eller flera outliers inom en uppsättning data, vilket sker både under och över minimi- och maximivärdena. Genom att förlänga de mindre och större datavärdena till max 1,5 gånger interkvartilområdet, ger lådans plot avvikare eller dunkla resultat. Eventuella resultat av data som faller utanför de minimala och maximala värdena som kallas utelämnare är lätta att bestämma på en ruttsplotdiagram.