Interkvartilintervallet, ofta förkortat som IQR, representerar intervallet från den 25: e percentilen till den 75: e percentilen, eller den mittersta 50 procenten, av en given datauppsättning. Interkvartilintervallet kan användas för att bestämma vad det genomsnittliga prestanda för ett test skulle vara: du kan använda det för att se var de flesta poäng för ett visst test faller, eller för att bestämma hur mycket pengar den genomsnittliga anställden i ett företag tjänar varje månad . Interkvartilintervallet kan vara ett mer effektivt verktyg för dataanalys än medelvärdet eller medianen för en datauppsättning, eftersom det låter dig identifiera spridningsområdet snarare än bara ett enda nummer.
TL; DR (för långt) ; Läste inte)
Interkvartilintervallet (IQR) representerar de mittersta 50 procenten av en datamängd. För att beräkna det, beställ först dina datapunkter från minst till störst, bestäm sedan dina första och tredje kvartilpositioner med hjälp av formlerna (N + 1) /4 och 3 * (N + 1) /4, där N är numret Slutligen subtrahera den första kvartilen från den tredje kvartilen för att bestämma interkvartilintervallet för datauppsättningen.
Beställ datapunkter
Beräkningen av interkvartilområdet är en enkel uppgift, men innan du beräknar måste du ordna de olika poäng i din datauppsättning. För att göra detta börjar du med att beställa dina datapunkter från minst till största. Om dina datapunkter till exempel var 10, 19, 8, 4, 9, 12, 15, 11 och 20, skulle du ordna om dem så här: {4, 8, 9, 10, 11, 12, 15, 19, 20}. När dina datapunkter har beställts så här kan du gå vidare till nästa steg.
Bestäm första kvartilpositionen <<> Bestäm sedan positionen för den första kvartilen med följande formel: (N + 1 ) /4, där N är antalet punkter i datauppsättningen. Om den första kvartilen faller mellan två siffror, tar du genomsnittet av de två siffrorna som din första kvartil-poäng. I exemplet ovan, eftersom det finns nio datapunkter, skulle du lägga till 1 till 9 för att få 10 och sedan dela med 4 för att få 2,5. Eftersom den första kvartilen faller mellan det andra och det tredje värdet, skulle du ta genomsnittet 8 och 9 för att få en första kvartilposition på 8,5.
Bestäm tredje kvartilpositionen
När du har bestämt din första quartile, bestäm den position för den tredje kvartilen med följande formel: 3 * (N + 1) /4 där N igen är antalet punkter i datauppsättningen. På samma sätt, om den tredje kvartilen faller mellan två siffror, tar du bara genomsnittet som du skulle göra när du beräknar den första kvartilens poäng. I exemplet ovan, eftersom det finns nio datapunkter, skulle du lägga till 1 till 9 för att få 10, multiplicera med 3 för att få 30 och sedan dela med 4 för att få 7,5. Eftersom den första kvartilen faller mellan det sjunde och åttonde värdet, skulle du ta genomsnittet 15 och 19 för att få en tredje kvartil-poäng på 17.
Beräkna Interquartile Range
När du har bestämt din första och tredje kvartilerna, beräkna interkvartilintervallet genom att subtrahera värdet på den första kvartilen från värdet på den tredje kvartilen. För att avsluta exemplet som använts under denna artikel, skulle du subtrahera 8.5 från 17 för att upptäcka att interkvartsområdet för datauppsättningen är lika med 8.5.
Fördelar och nackdelar med IQR.
Interkvartilområdet har en fördel med att kunna identifiera och eliminera outliers i båda ändarna av en datauppsättning. IQR är också ett bra mått på variation i fall av skev datadistribution, och denna metod för att beräkna IQR kan fungera för grupperade datauppsättningar, så länge du använder en kumulativ frekvensfördelning för att organisera dina datapunkter. Interkvartilintervallformeln för grupperade data är densamma som för icke-grupperade data, där IQR är lika med värdet på den första kvartilen subtraheras från värdet på den tredje kvartilen. Men det har flera nackdelar jämfört med standardavvikelse: mindre känslighet för några extrema poäng och en stickprovstabilitet som inte är lika stark som standardavvikelse.