Chi-kvadrat, mer känd som Pearson's chi-square test, är ett sätt att statistiskt utvärdera data. Den används när kategoriska data från en provtagning jämförs med förväntade eller "sanna" resultat. Om vi till exempel tror att 50 procent av alla gelébönor i en behållare är röda, ska ett urval av 100 bönor från den bin innehålla ungefär 50 som är röda. Om vårt tal skiljer sig från 50, berättar Pearsons test om vårt 50 procent antagande är misstänkt, eller om vi kan ange skillnaden såg vi till normal slumpmässig variation.
Tolkning av Chi-kvadratvärden
Bestäm frihetsgraderna för ditt chi-kvadratiska värde. Om du jämför resultat för ett enda prov med flera kategorier, är graden av frihet antalet kategorier minus 1. Om du till exempel utvärderar färgfördelningen i en burk jellybeans och det fanns fyra färger, graderna av friheten skulle vara 3. Om du jämför tabelldata är graden av frihet lika med antalet rader minus 1 multiplicerat med antalet kolumner minus 1.
Bestäm det kritiska p-värdet som du ska använda för att utvärdera dina data . Detta är procent sannolikheten (dividerat med 100) att ett specifikt chi-kvadratvärde erhölls av en slump ensam. Ett annat sätt att tänka på p är att det är sannolikheten för att dina observerade resultat avviker från de förväntade resultaten med det belopp som de uteslutande berodde på slumpmässig variation i provtagningsprocessen.
Slå upp p-värdet associerat med din chi-kvadratprovstatistik med hjälp av chi-kvadratdistributionstabellen. För att göra detta, se längden på rad som motsvarar dina beräknade grader av frihet. Hitta värdet i den här raden närmast din teststatistik. Följ kolumnen som innehåller det värdet uppåt till den övre raden och avläs p-värdet. Om din teststatistik ligger mellan två värden i den första raden kan du avläsa ett ungefärligt p-värde mellan två p-värden i den övre raden.
Jämför p-värdet från tabellen till den kritiska p värde tidigare beslutat. Om ditt tabellvärde ligger över det kritiska värdet kommer du att dra slutsatsen att en avvikelse mellan provkategorivärdena och de förväntade värdena berodde på slumpmässig variation och var inte signifikant. Om du till exempel valde ett kritiskt p-värde på 0,05 (eller 5%) och hittade ett tabellvärde på 0,20, skulle du dra slutsatsen att det inte fanns någon signifikant variation.
Tips
Kom ihåg att alla slutsats som gjorts på grundval av detta test kommer fortfarande att ha en chans att vara fel, proportionellt mot det erhållna p-värdet.
Varning
Värdet som erhållits för varje kategori i provet ska vara minst 5 för Resultatet är giltigt.