Test t — rodzaje, wzór i kiedy stosować

Test t pomaga zdecydować, czy średnia z próby albo różnica między dwiema średnimi z prób jest większa, niż można by oczekiwać wyłącznie na skutek losowej zmienności. Stosuje się go wtedy, gdy zmienna wynikowa jest liczbowa, a odchylenie standardowe populacji jest nieznane, co w praktyce zdarza się najczęściej.

Najważniejszy warunek jest taki, że test musi pasować do schematu danych. Test t służy do pytań o średnie, a nie o liczebności w kategoriach, a przy bardzo małych próbach trzeba zachować ostrożność, jeśli dane są silnie skośne lub zawierają wyraźne wartości odstające.

Co mierzy test t

Podstawowa idea jest zawsze taka sama:

t = \frac{\text{observed difference}}{\text{estimated standard error}}

Statystyka rośnie, gdy różnica średnich jest duża, a maleje, gdy dane są bardziej zaszumione lub próba jest mała.

Przy założeniu prawdziwości hipotezy zerowej, i jeśli warunki są rozsądnie spełnione, ta statystyka ma rozkład $t$ , a nie normalny rozkład $z$ . Rozkład $t$ ma grubsze ogony, szczególnie dla małych prób, więc ostrożniej uznaje wynik za istotny statystycznie.

Który rodzaj testu t wybrać

Test t dla jednej próby

Użyj go wtedy, gdy masz jedną próbę i chcesz porównać jej średnią z wartością odniesienia $\mu_0$ .

t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

Przykład: porównanie średniej masy opakowania w jednej próbie z wartością docelową $100$ gramów.

Test t dla dwóch prób

Użyj go wtedy, gdy chcesz porównać średnie w dwóch niezależnych grupach, na przykład w dwóch klasach uczonych różnymi metodami.

Jeśli nie masz mocnych podstaw, by zakładać równość wariancji w populacjach, test t Welcha jest zwykle bezpieczniejszym wyborem domyślnym:

t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

Liczba stopni swobody w teście Welcha nie jest po prostu równa $n_1 + n_2 - 2$ , więc ten etap zwykle wykonuje za Ciebie oprogramowanie.

Test t dla prób zależnych

Użyj go dla danych typu przed i po albo dla par dopasowanych. Testu nie wykonuje się osobno dla dwóch surowych kolumn danych. Wykonuje się go na różnicach w parach.

t = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

W wielu zadaniach z próbami zależnymi wartość zerowa ma postać $\mu_{d,0} = 0$ , co oznacza, że średnia zmiana wynosi zero.

Kiedy test t jest odpowiedni

Test t dobrze pasuje, gdy wszystkie poniższe warunki są w przybliżeniu spełnione:

Zmienna wynikowa jest liczbowa.
Obserwacje są niezależne w ramach wybranego schematu, chyba że celowo stosujesz układ sparowany.
Pytanie dotyczy średniej albo różnicy średnich.
Próba nie jest tak mała i zniekształcona przez wartości odstające lub silną skośność, że średnia i odchylenie standardowe stają się mylące.

Gdyby odchylenie standardowe populacji było dokładnie znane, bezpośrednią alternatywą byłby podręcznikowy test $z$ . W praktyce testy t są powszechne, ponieważ $\sigma$ zwykle jest nieznane.

Przykład obliczeniowy: test t dla jednej próby

Załóżmy, że proces pakowania powinien dawać średnio $100$ gramów. Losujesz próbę $25$ opakowań i otrzymujesz

\bar{x} = 102, \quad s = 4

Chcesz sprawdzić, czy prawdziwa średnia różni się od $100$ gramów.

Ponieważ jest to jedna próba porównywana z wartością docelową, właściwym testem jest test t dla jednej próby.

Zacznij od hipotez:

H_0: \mu = 100

H_1: \mu \ne 100

Błąd standardowy wynosi

\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

Teraz oblicz statystykę testową:

t = \frac{102 - 100}{0.8} = 2.5

Liczba stopni swobody wynosi

df = n - 1 = 24

Dla testu dwustronnego przy $df = 24$ wartość $t = 2.5$ daje p-value mniejsze niż $0.05$ . Oznacza to, że wynik jest istotny statystycznie na poziomie $5\%$ , więc odrzucasz $H_0$ .

W kontekście tego zadania próba dostarcza dowodów, że średnia procesu różni się od $100$ gramów. Ten wniosek zależy od tego, czy obserwacje w próbie są w przybliżeniu niezależne i czy dane nie są silnie zniekształcone przez wartości odstające.

Najczęstsze błędy przy testach t

Jednym z częstych błędów jest wybór niewłaściwej wersji testu. Jeśli te same osoby, maszyny lub jednostki są mierzone dwa razy, dane są sparowane, więc niezależny test t dla dwóch prób nie jest odpowiedni.

Innym błędem jest odczytywanie wyniku „nieistotny statystycznie” jako „nie ma różnicy”. Zwykle oznacza to, że próba nie dostarczyła wystarczająco silnych dowodów przeciwko hipotezie zerowej.

Trzecim błędem jest pomijanie sprawdzenia danych. Przy bardzo małej próbie i jednej skrajnej wartości odstającej wzór nadal daje liczbę, ale wniosek może być niewiarygodny.

Gdzie stosuje się testy t

Testy t są powszechne w eksperymentach, kontroli jakości, medycynie, psychologii, edukacji oraz w porównaniach typu A/B, gdy zmienna wynikowa jest liczbowa. To jeden ze standardowych punktów wejścia do wnioskowania statystycznego, ponieważ łączy średnie, zmienność, niepewność i podejmowanie decyzji w jednej metodzie.

Spróbuj podobnego zadania

Zmień przykład tak, aby średnia z próby wynosiła $101$ zamiast $102$ , przy zachowaniu $n = 25$ oraz $s = 4$ . Ponownie oblicz statystykę t i zdecyduj, czy dowody są nadal wystarczająco mocne na poziomie $5\%$ . To dobry kolejny krok, jeśli chcesz zobaczyć, jak zmienia się wniosek, gdy średnia z próby zbliża się do wartości z hipotezy zerowej.

Potrzebujesz pomocy z zadaniem?

Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.

Otwórz GPAI Solver →