Test chi-kwadrat | GPAI STEM

Test chi-kwadrat sprawdza, czy liczebności w kategoriach odbiegają zbyt mocno od tego, czego model oczekiwałby wyłącznie na skutek przypadku. Stosuje się go do liczebności w kategoriach, a nie do średnich ani surowych pomiarów.

Podstawowa idea jest prosta: porównujesz to, co zaobserwowano, z tym, czego należałoby oczekiwać, gdyby hipoteza zerowa była prawdziwa. Jeśli różnice są wystarczająco duże, statystyka chi-kwadrat przyjmuje dużą wartość, a dane stanowią dowód przeciwko temu modelowi zerowemu.

Co ten test naprawdę porównuje

W najczęstszym ujęciu masz zaobserwowane liczebności $O$ i oczekiwane liczebności $E$ dla każdej kategorii. Statystyka testowa ma postać

\chi^2 = \sum \frac{(O - E)^2}{E}

Ta liczba rośnie, gdy zaobserwowane liczebności coraz bardziej odbiegają od oczekiwanych. Większe rozbieżności mają większe znaczenie, a kategorie z większymi oczekiwanymi liczebnościami są odpowiednio skalowane.

Oczekiwane liczebności nie są zgadywane przypadkowo. Wynikają one z hipotezy zerowej. W teście zgodności hipoteza zerowa może mówić, że wszystkie kategorie są jednakowo prawdopodobne. W teście niezależności hipoteza zerowa mówi, że dwie zmienne kategorialne nie są ze sobą powiązane.

Dwie częste wersje

Wyrażenie „test chi-kwadrat” zwykle odnosi się do jednej z tych dwóch wersji:

Test zgodności, który sprawdza, czy jedna zmienna kategorialna ma zadany rozkład.
Test niezależności, który sprawdza, czy dwie zmienne kategorialne są ze sobą powiązane w tabeli kontyngencji.

W obu przypadkach używa się tej samej rodziny statystyk, ale sposób obliczania oczekiwanych liczebności zależy od wersji testu.

Przykład obliczeniowy: test zgodności

Załóżmy, że kawiarnia chce sprawdzić, czy trzy rozmiary napojów są wybierane równie często. Wśród $60$ zamówień zaobserwowane liczebności są następujące:

Mały: $26$
Średni: $18$
Duży: $16$

Jeśli hipoteza zerowa mówi, że wszystkie trzy rozmiary są jednakowo prawdopodobne, to oczekiwana liczebność w każdej kategorii wynosi

E = \frac{60}{3} = 20

Teraz obliczamy statystykę:

\chi^2 = \frac{(26-20)^2}{20} + \frac{(18-20)^2}{20} + \frac{(16-20)^2}{20}

= \frac{36}{20} + \frac{4}{20} + \frac{16}{20}

= 1.8 + 0.2 + 0.8 = 2.8

To jest statystyka testowa, ale sama w sobie nie stanowi jeszcze ostatecznego wniosku. Należy porównać $\chi^2 = 2.8$ z rozkładem chi-kwadrat przy odpowiedniej liczbie stopni swobody. Tutaj liczba stopni swobody wynosi $3 - 1 = 2$ , ponieważ są trzy kategorie i nie estymowano żadnych parametrów na podstawie danych. Dla $df = 2$ statystyka równa $2.8$ nie stanowi mocnego dowodu przeciwko równej preferencji na poziomie $5\%$ .

Praktyczna interpretacja jest taka: liczebności różnią się od idealnej równości, ale nie na tyle, by na podstawie samej tej próby z przekonaniem stwierdzić, że rzeczywiste preferencje są nierówne.

Kiedy ten test ma sens

Użyj testu chi-kwadrat, gdy wszystkie poniższe warunki są spełnione:

Twoje dane to zbiór liczebności w kategoriach.
Obserwacje są niezależne albo wystarczająco bliskie niezależności dla modelu, którego używasz.
Oczekiwane liczebności nie są zbyt małe dla przybliżenia chi-kwadrat, które zamierzasz zastosować.

W wielu wprowadzających zastosowaniach używa się praktycznej reguły, że oczekiwane liczebności powinny wynosić co najmniej około $5$ w każdej kategorii. To praktyczna wskazówka, a nie uniwersalne prawo, ale jest to użyteczny sygnał ostrzegawczy.

Częste błędy

Stosowanie testu do średnich, pomiarów lub procentów zamiast do liczebności kategorii.
Traktowanie zaobserwowanych liczebności jako oczekiwanych. Oczekiwane liczebności muszą wynikać z hipotezy zerowej.
Ignorowanie małych oczekiwanych liczebności, co może sprawić, że zwykłe przybliżenie chi-kwadrat będzie niewiarygodne.
Mylenie „istotności statystycznej” z „praktycznym znaczeniem”. Test mówi tylko o dowodach przeciwko modelowi zerowemu.

Gdzie się go spotyka

Testy chi-kwadrat pojawiają się w badaniach ankietowych, genetyce, kontroli jakości, badaniach rynku i wszędzie tam, gdzie wyniki wpadają do kategorii. Są szczególnie częste wtedy, gdy prawdziwe pytanie brzmi, czy dany wzorzec jest zaskakujący albo czy dwie zmienne kategorialne wydają się ze sobą powiązane.

Jeśli dane są liczbowe, a nie kategorialne, zwykle lepsze jest inne narzędzie. Na przykład porównywanie średnich często prowadzi zamiast tego do testu $t$ lub analizy ANOVA.

Wypróbuj własną wersję

Weź małą tabelę liczebności kategorii i zapisz hipotezę zerową, zanim wykonasz jakiekolwiek obliczenia. Ten jeden krok zwykle pozwala uniknąć największego błędu w zadaniach z testem chi-kwadrat: użycia poprawnego wzoru z błędnymi oczekiwanymi liczebnościami.

Potrzebujesz pomocy z zadaniem?

Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.

Otwórz GPAI Solver →