Statistiker och evolutionsbiolog Ronald Fisher utvecklade ANOVA, eller variansanalys, för att vara ett medel för ett slut. Det kan hjälpa dig ta reda på om resultaten från ett experiment, en undersökning eller en studie kan stödja hypotesen. Med ANOVA kan du snabbt bestämma om en hypotes är sann eller falsk.
Vad är ANOVA?
ANOVA används för att utvärdera variansen mellan gruppmedel i ett prov och är en samling av statistiska modeller och deras relaterade uppskattningsförfaranden. Det är i princip variationen mellan två kända datagrupper. Den erbjuder ett statistiskt test av huruvida populationens medel för flera uppsättningar av data faktiskt är lika. Därefter generaliseras t-testet, eller en analys av två populationsmedel genom statistisk undersökning, till mer än två grupper. Ett t-test visar om det finns en signifikant skillnad mellan befolkningsmedlet och ett hypotiserat värde. Storleken på skillnaden i förhållande till variationen i exempeldata är t-värdet.
One Way or Two Way?
Antalet oberoende variabler i analysen av varianstest som du använder avgör om ANOVA är det ena eller det andra. Ett envägstest har en enda oberoende variabel med två nivåer. En tvåvägsanalys av varianstest har två oberoende variabler. Ett tvåvägstest kan ha en mängd nivåer. Ett exempel på en enväg skulle vara att jämföra två märken av gelé. En tvåväg skulle jämföra märken av gelé samt kalorier, fett, socker eller kolhydratnivåer.
Nivåerna inkluderar de olika grupperna som alla är i samma oberoende variabel. Replikering är när du upprepar testerna med flera grupper. En tvåvägsanalys av varians med replikering använder två grupper och individer inom gruppen som gör flera saker. Tvåvägs ANOVA-test kan genomföras med eller utan replikering. Hur man gör ANOVA för hand.
Det finns statistisk programvara som snabbt och enkelt kan beräkna ANOVA, men det är en fördel att beräkna ANOVA för hand . Det låter dig förstå de enskilda stegen som är involverade såväl som hur de var och en bidrar till att visa skillnaderna mellan flera grupper.
Samla den grundläggande sammanfattande statistiken för de data som du har samlat in. Den sammanfattande statistiken inkluderar de enskilda datapunkterna för den första gruppen, märkt "x", och antalet datapunkter för den andra individuella varianten, "y." Antalet datapunkter för varje grupp är märkt "n."
Lägg till poängen för den första gruppen, märkt "SX." Den andra gruppen data som samlas in är "SY."
För att beräkna medelvärdet, använd formeln, C \u003d (SX + SY) ^ 2 /(2n).
Beräkna summan av kvadratet mellan grupperna, SSB \u003d [(SX ^ 2 + SY ^ 2) /n] - C.
När du har kvadrat alla datapunkterna, summera dem i en slutlig summa av "D.".
Beräkna sedan summan av kvadraterna totalt, SST \u003d D - C.
Använd formeln SST - SSB för att hitta SSW, eller summan av rutor i grupper.
Räkna frihetsgraderna mellan grupperna, "dfb," och inom grupperna, "dfw."
Formeln för mellan grupper är dfb \u003d 1 och för inom grupperna är den dfw \u003d 2n-2.
Beräkna medelkvadratet för inom grupperna, MSW \u003d SSW /dfw.
Slutligen beräkna den slutliga statistiken, eller "F", F \u003d MSB /MSW