Pålitlighet:
* Test-retest Tillförlitlighet: Detta mäter hur konsekventa resultaten är över tid. STAR-test visar i allmänhet acceptabel test-test-tillförlitlighet, vilket innebär att eleverna tenderar att göra poäng på liknande sätt när de tar samma test upprepade gånger.
* intern konsistens: Detta mäter hur väl olika delar av samma test mäter samma sak. Stjärntester visar i allmänhet god intern konsistens, vilket innebär att de olika delarna av testet mäter liknande färdigheter.
* Inter-rater-tillförlitlighet: Detta är inte relevant för standardiserade tester som Star, som är maskinresultat.
Giltighet:
* Innehållsgiltighet: Detta mäter hur väl testet täcker innehållet som det ska mäta. Detta är ett kritiskt debattområde för stjärntester. Medan testerna är anpassade till Kaliforniens statliga standarder, finns det pågående diskussioner om de fullt ut fångar bredden och djupet i dessa standarder.
* Konstruktionsgiltighet: Detta mäter om testet exakt mäter de underliggande färdigheterna och kunskapen det är avsett att mäta. Det finns vissa bevis som tyder på att stjärntester inte helt fångar de komplexa konstruktioner som kritiskt tänkande och problemlösning som är viktiga för studenternas framgång.
* Förutsägbar giltighet: Detta mäter hur väl testet förutsäger framtida framgång inom relaterade områden, som college eller karriärprestanda. Den prediktiva giltigheten av stjärntester är föremål för pågående forskning, med olika resultat beroende på det specifika måttet på framgång.
Utmaningar och kritik:
* Överbetoning vid standardiserad testning: Kritiker hävdar att fokuset på stjärnpoäng kan leda till "undervisning i testet" och försumma andra viktiga aspekter av utbildning.
* Begränsat omfattning: Vissa hävdar att stjärntester är för smala i sitt fokus och misslyckas med att bedöma färdigheter och kunskaper som är viktiga för framgången från 2000-talet.
* kulturell partiskhet: Det finns oro för potentiella kulturella fördomar inom testerna, som orättvist kan nackdelar med vissa studentgrupper.
Sammanfattningsvis:
Tillförlitligheten hos stjärntester anses i allmänhet vara acceptabel, medan giltigheten är mer nyanserad och föremål för pågående debatt. Testerna har kritiserats för sin överbeton vid standardiserad testning, deras begränsade omfattning och potentiella kulturella fördomar.
Det är viktigt att överväga stjärnresultat inom ett bredare sammanhang av studentprestanda, med hänsyn till faktorer som individuell studenttillväxt, klassrumsobservationer och andra bedömningar.