Interquartile range (IQR) är ett mått på variabilitet, eller hur spridd en datamängd är. Den beräknas genom att subtrahera den första kvartilen (Q1) från den tredje kvartilen (Q3).
$$IQR =Q3-Q1$$
Det är ett mer robust mått på variabilitet än intervallet eftersom det inte påverkas av extremvärden.
För att beräkna IQR måste du först hitta medianen för datamängden. Medianen är mittvärdet av datamängden när den är sorterad i stigande ordning. Om det finns två mittental är medianen medelvärdet av dessa två tal.
När du har medianen kan du hitta den första kvartilen och den tredje kvartilen.
Första kvartilen (Q1):
- är det mellersta värdet av den nedre halvan av datan
- För en datamängd med ett udda antal värden:Q1 är värdet i mitten
- För en datamängd med jämna antal värden är Q1 medelvärdet av de två mittersta värdena.
Tredje kvartilen (Q3):
- är mittvärdet av den övre halvan av datamängden.
- För datauppsättning med udda antal värden:Q3 är värdet i mitten
- För en datamängd med jämnt antal värden är Q3 medelvärdet av de två mittersta värdena
När du har Q1 och Q3 kan du beräkna IQR som
$$IQR =Q3-Q1$$
Exempel:
Beräkna IQR för data:
2, 4, 5, 7, 9, 11, 13, 15, 17, 19
1. Hitta medianen:
Sortera nummer från minsta till största
2, 4, 5, 7, 9, 11, 13, 15, 17, 19
Median =(9+11)/2 =10
2. Hitta Q1 och Q3 :
Halvvägs ligger data under 10 och hälften ligger över
Nedre halvan:2, 4, 5, 7, 9
Q1, mittvärdet av den nedre halvan =7
Övre halvan:11, 13, 15, 17, 19
Q3, mittvärdet av den övre halvan =15
3. Beräkna IQR :
$$IQR =Q3 - Q1$$
$$IQR =15 - 7 =8 $$
Därför är IQR för den givna datamängden 8.
IQR kan visualiseras med hjälp av en boxplot. En ruta visar medianen, Q1, Q3 och dataområdet.
```
+------------------------+
| | |
| | | |
|----------------|---|----------------|
| | | | | |
+------------------------+
```
- Lådan: representerar de mellersta 50 % av data (mellan Q1 och Q3)
- Roden i rutan: representerar medianen
- Lådans ändar (morrhår): sträcka sig till de mest extrema värden som inte anses vara extremvärden
- Utstående: är värden som är mer än 1,5 gånger IQR över Q3 eller under Q1.
De representeras som individuella punkter utanför morrhåren.
Boxplots är ett användbart verktyg för att visuellt jämföra fördelningarna av olika datamängder.
Interkvartilintervall (IQR) är ett mått på variabilitet som inte påverkas av extremvärden.
Den beräknas genom att subtrahera den första kvartilen (Q1) från den tredje kvartilen (Q3).
IQR kan visualiseras med hjälp av boxplot.