Test t pomaga zdecydować, czy średnia z próby albo różnica między dwiema średnimi z prób jest większa, niż można by oczekiwać wyłącznie na skutek losowej zmienności. Stosuje się go wtedy, gdy zmienna wynikowa jest liczbowa, a odchylenie standardowe populacji jest nieznane, co w praktyce zdarza się najczęściej.
Najważniejszy warunek jest taki, że test musi pasować do schematu danych. Test t służy do pytań o średnie, a nie o liczebności w kategoriach, a przy bardzo małych próbach trzeba zachować ostrożność, jeśli dane są silnie skośne lub zawierają wyraźne wartości odstające.
Co mierzy test t
Podstawowa idea jest zawsze taka sama:
Statystyka rośnie, gdy różnica średnich jest duża, a maleje, gdy dane są bardziej zaszumione lub próba jest mała.
Przy założeniu prawdziwości hipotezy zerowej, i jeśli warunki są rozsądnie spełnione, ta statystyka ma rozkład , a nie normalny rozkład . Rozkład ma grubsze ogony, szczególnie dla małych prób, więc ostrożniej uznaje wynik za istotny statystycznie.
Który rodzaj testu t wybrać
Test t dla jednej próby
Użyj go wtedy, gdy masz jedną próbę i chcesz porównać jej średnią z wartością odniesienia .
Przykład: porównanie średniej masy opakowania w jednej próbie z wartością docelową gramów.
Test t dla dwóch prób
Użyj go wtedy, gdy chcesz porównać średnie w dwóch niezależnych grupach, na przykład w dwóch klasach uczonych różnymi metodami.
Jeśli nie masz mocnych podstaw, by zakładać równość wariancji w populacjach, test t Welcha jest zwykle bezpieczniejszym wyborem domyślnym:
Liczba stopni swobody w teście Welcha nie jest po prostu równa , więc ten etap zwykle wykonuje za Ciebie oprogramowanie.
Test t dla prób zależnych
Użyj go dla danych typu przed i po albo dla par dopasowanych. Testu nie wykonuje się osobno dla dwóch surowych kolumn danych. Wykonuje się go na różnicach w parach.
W wielu zadaniach z próbami zależnymi wartość zerowa ma postać , co oznacza, że średnia zmiana wynosi zero.
Kiedy test t jest odpowiedni
Test t dobrze pasuje, gdy wszystkie poniższe warunki są w przybliżeniu spełnione:
- Zmienna wynikowa jest liczbowa.
- Obserwacje są niezależne w ramach wybranego schematu, chyba że celowo stosujesz układ sparowany.
- Pytanie dotyczy średniej albo różnicy średnich.
- Próba nie jest tak mała i zniekształcona przez wartości odstające lub silną skośność, że średnia i odchylenie standardowe stają się mylące.
Gdyby odchylenie standardowe populacji było dokładnie znane, bezpośrednią alternatywą byłby podręcznikowy test . W praktyce testy t są powszechne, ponieważ zwykle jest nieznane.
Przykład obliczeniowy: test t dla jednej próby
Załóżmy, że proces pakowania powinien dawać średnio gramów. Losujesz próbę opakowań i otrzymujesz
Chcesz sprawdzić, czy prawdziwa średnia różni się od gramów.
Ponieważ jest to jedna próba porównywana z wartością docelową, właściwym testem jest test t dla jednej próby.
Zacznij od hipotez:
Błąd standardowy wynosi
Teraz oblicz statystykę testową:
Liczba stopni swobody wynosi
Dla testu dwustronnego przy wartość daje p-value mniejsze niż . Oznacza to, że wynik jest istotny statystycznie na poziomie , więc odrzucasz .
W kontekście tego zadania próba dostarcza dowodów, że średnia procesu różni się od gramów. Ten wniosek zależy od tego, czy obserwacje w próbie są w przybliżeniu niezależne i czy dane nie są silnie zniekształcone przez wartości odstające.
Najczęstsze błędy przy testach t
Jednym z częstych błędów jest wybór niewłaściwej wersji testu. Jeśli te same osoby, maszyny lub jednostki są mierzone dwa razy, dane są sparowane, więc niezależny test t dla dwóch prób nie jest odpowiedni.
Innym błędem jest odczytywanie wyniku „nieistotny statystycznie” jako „nie ma różnicy”. Zwykle oznacza to, że próba nie dostarczyła wystarczająco silnych dowodów przeciwko hipotezie zerowej.
Trzecim błędem jest pomijanie sprawdzenia danych. Przy bardzo małej próbie i jednej skrajnej wartości odstającej wzór nadal daje liczbę, ale wniosek może być niewiarygodny.
Gdzie stosuje się testy t
Testy t są powszechne w eksperymentach, kontroli jakości, medycynie, psychologii, edukacji oraz w porównaniach typu A/B, gdy zmienna wynikowa jest liczbowa. To jeden ze standardowych punktów wejścia do wnioskowania statystycznego, ponieważ łączy średnie, zmienność, niepewność i podejmowanie decyzji w jednej metodzie.
Spróbuj podobnego zadania
Zmień przykład tak, aby średnia z próby wynosiła zamiast , przy zachowaniu oraz . Ponownie oblicz statystykę t i zdecyduj, czy dowody są nadal wystarczająco mocne na poziomie . To dobry kolejny krok, jeśli chcesz zobaczyć, jak zmienia się wniosek, gdy średnia z próby zbliża się do wartości z hipotezy zerowej.
Potrzebujesz pomocy z zadaniem?
Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.
Otwórz GPAI Solver →