Test t pomaga zdecydować, czy średnia z próby albo różnica między dwiema średnimi z prób jest większa, niż można by oczekiwać wyłącznie na skutek losowej zmienności. Stosuje się go wtedy, gdy zmienna wynikowa jest liczbowa, a odchylenie standardowe populacji jest nieznane, co w praktyce zdarza się najczęściej.

Najważniejszy warunek jest taki, że test musi pasować do schematu danych. Test t służy do pytań o średnie, a nie o liczebności w kategoriach, a przy bardzo małych próbach trzeba zachować ostrożność, jeśli dane są silnie skośne lub zawierają wyraźne wartości odstające.

Co mierzy test t

Podstawowa idea jest zawsze taka sama:

t=observed differenceestimated standard errort = \frac{\text{observed difference}}{\text{estimated standard error}}

Statystyka rośnie, gdy różnica średnich jest duża, a maleje, gdy dane są bardziej zaszumione lub próba jest mała.

Przy założeniu prawdziwości hipotezy zerowej, i jeśli warunki są rozsądnie spełnione, ta statystyka ma rozkład tt, a nie normalny rozkład zz. Rozkład tt ma grubsze ogony, szczególnie dla małych prób, więc ostrożniej uznaje wynik za istotny statystycznie.

Który rodzaj testu t wybrać

Test t dla jednej próby

Użyj go wtedy, gdy masz jedną próbę i chcesz porównać jej średnią z wartością odniesienia μ0\mu_0.

t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

Przykład: porównanie średniej masy opakowania w jednej próbie z wartością docelową 100100 gramów.

Test t dla dwóch prób

Użyj go wtedy, gdy chcesz porównać średnie w dwóch niezależnych grupach, na przykład w dwóch klasach uczonych różnymi metodami.

Jeśli nie masz mocnych podstaw, by zakładać równość wariancji w populacjach, test t Welcha jest zwykle bezpieczniejszym wyborem domyślnym:

t=xˉ1xˉ2s12n1+s22n2t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

Liczba stopni swobody w teście Welcha nie jest po prostu równa n1+n22n_1 + n_2 - 2, więc ten etap zwykle wykonuje za Ciebie oprogramowanie.

Test t dla prób zależnych

Użyj go dla danych typu przed i po albo dla par dopasowanych. Testu nie wykonuje się osobno dla dwóch surowych kolumn danych. Wykonuje się go na różnicach w parach.

t=dˉμd,0sd/nt = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

W wielu zadaniach z próbami zależnymi wartość zerowa ma postać μd,0=0\mu_{d,0} = 0, co oznacza, że średnia zmiana wynosi zero.

Kiedy test t jest odpowiedni

Test t dobrze pasuje, gdy wszystkie poniższe warunki są w przybliżeniu spełnione:

  1. Zmienna wynikowa jest liczbowa.
  2. Obserwacje są niezależne w ramach wybranego schematu, chyba że celowo stosujesz układ sparowany.
  3. Pytanie dotyczy średniej albo różnicy średnich.
  4. Próba nie jest tak mała i zniekształcona przez wartości odstające lub silną skośność, że średnia i odchylenie standardowe stają się mylące.

Gdyby odchylenie standardowe populacji było dokładnie znane, bezpośrednią alternatywą byłby podręcznikowy test zz. W praktyce testy t są powszechne, ponieważ σ\sigma zwykle jest nieznane.

Przykład obliczeniowy: test t dla jednej próby

Załóżmy, że proces pakowania powinien dawać średnio 100100 gramów. Losujesz próbę 2525 opakowań i otrzymujesz

xˉ=102,s=4\bar{x} = 102, \quad s = 4

Chcesz sprawdzić, czy prawdziwa średnia różni się od 100100 gramów.

Ponieważ jest to jedna próba porównywana z wartością docelową, właściwym testem jest test t dla jednej próby.

Zacznij od hipotez:

H0:μ=100H_0: \mu = 100 H1:μ100H_1: \mu \ne 100

Błąd standardowy wynosi

sn=425=45=0.8\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

Teraz oblicz statystykę testową:

t=1021000.8=2.5t = \frac{102 - 100}{0.8} = 2.5

Liczba stopni swobody wynosi

df=n1=24df = n - 1 = 24

Dla testu dwustronnego przy df=24df = 24 wartość t=2.5t = 2.5 daje p-value mniejsze niż 0.050.05. Oznacza to, że wynik jest istotny statystycznie na poziomie 5%5\%, więc odrzucasz H0H_0.

W kontekście tego zadania próba dostarcza dowodów, że średnia procesu różni się od 100100 gramów. Ten wniosek zależy od tego, czy obserwacje w próbie są w przybliżeniu niezależne i czy dane nie są silnie zniekształcone przez wartości odstające.

Najczęstsze błędy przy testach t

Jednym z częstych błędów jest wybór niewłaściwej wersji testu. Jeśli te same osoby, maszyny lub jednostki są mierzone dwa razy, dane są sparowane, więc niezależny test t dla dwóch prób nie jest odpowiedni.

Innym błędem jest odczytywanie wyniku „nieistotny statystycznie” jako „nie ma różnicy”. Zwykle oznacza to, że próba nie dostarczyła wystarczająco silnych dowodów przeciwko hipotezie zerowej.

Trzecim błędem jest pomijanie sprawdzenia danych. Przy bardzo małej próbie i jednej skrajnej wartości odstającej wzór nadal daje liczbę, ale wniosek może być niewiarygodny.

Gdzie stosuje się testy t

Testy t są powszechne w eksperymentach, kontroli jakości, medycynie, psychologii, edukacji oraz w porównaniach typu A/B, gdy zmienna wynikowa jest liczbowa. To jeden ze standardowych punktów wejścia do wnioskowania statystycznego, ponieważ łączy średnie, zmienność, niepewność i podejmowanie decyzji w jednej metodzie.

Spróbuj podobnego zadania

Zmień przykład tak, aby średnia z próby wynosiła 101101 zamiast 102102, przy zachowaniu n=25n = 25 oraz s=4s = 4. Ponownie oblicz statystykę t i zdecyduj, czy dowody są nadal wystarczająco mocne na poziomie 5%5\%. To dobry kolejny krok, jeśli chcesz zobaczyć, jak zmienia się wniosek, gdy średnia z próby zbliża się do wartości z hipotezy zerowej.

Potrzebujesz pomocy z zadaniem?

Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.

Otwórz GPAI Solver →