T-Test — Τύποι, Τύπος & Πότε να το χρησιμοποιήσετε

Ένα t-test σε βοηθά να αποφασίσεις αν ένας δειγματικός μέσος, ή η διαφορά ανάμεσα σε δύο δειγματικούς μέσους, είναι μεγαλύτερη από ό,τι θα περίμενες μόνο από την τυχαία μεταβλητότητα. Το χρησιμοποιείς όταν η μεταβλητή αποτελέσματος είναι αριθμητική και η τυπική απόκλιση του πληθυσμού είναι άγνωστη, κάτι που είναι η συνηθισμένη περίπτωση στην πράξη.

Η βασική προϋπόθεση είναι ότι το τεστ πρέπει να ταιριάζει με το σχέδιο των δεδομένων. Ένα t-test χρησιμοποιείται για ερωτήματα σχετικά με μέσους όρους, όχι για κατηγορικές συχνότητες, και πολύ μικρά δείγματα χρειάζονται προσοχή αν έχουν έντονη ασυμμετρία ή εμφανείς ακραίες τιμές.

Τι μετρά ένα t-test

Η βασική ιδέα είναι πάντα η ίδια:

t = \frac{\text{observed difference}}{\text{estimated standard error}}

Το στατιστικό γίνεται μεγαλύτερο όταν η διαφορά των μέσων είναι μεγάλη, και μικρότερο όταν τα δεδομένα έχουν πολύ θόρυβο ή το δείγμα είναι μικρό.

Κάτω από τη μηδενική υπόθεση, και αν οι συνθήκες είναι λογικές, αυτό το στατιστικό ακολουθεί κατανομή $t$ και όχι την κανονική κατανομή $z$ . Η κατανομή $t$ έχει βαρύτερες ουρές, ειδικά για μικρά δείγματα, οπότε είναι πιο συντηρητική στο να χαρακτηρίσει ένα αποτέλεσμα ως στατιστικά σημαντικό.

Ποιον τύπο t-test πρέπει να χρησιμοποιήσετε

t-test ενός δείγματος

Χρησιμοποίησέ το όταν έχεις ένα δείγμα και θέλεις να συγκρίνεις τον μέσο του με μια τιμή αναφοράς $\mu_0$ .

t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

Παράδειγμα: σύγκρινε το μέσο βάρος συσκευασιών σε ένα δείγμα με έναν στόχο $100$ γραμμαρίων.

t-test δύο δειγμάτων

Χρησιμοποίησέ το όταν θέλεις να συγκρίνεις τους μέσους δύο ανεξάρτητων ομάδων, όπως δύο τάξεις που διδάχθηκαν με διαφορετικές μεθόδους.

Αν δεν έχεις ισχυρό λόγο να υποθέσεις ίσες διακυμάνσεις στους πληθυσμούς, το t-test του Welch είναι συνήθως η ασφαλέστερη προεπιλογή:

t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

Οι βαθμοί ελευθερίας για το τεστ του Welch δεν είναι απλώς $n_1 + n_2 - 2$ , οπότε αυτό το μέρος το αναλαμβάνει συνήθως το λογισμικό.

Ζευγαρωμένο t-test

Χρησιμοποίησέ το για δεδομένα πριν-και-μετά ή για αντιστοιχισμένα ζεύγη. Το τεστ δεν εφαρμόζεται ξεχωριστά στις δύο αρχικές στήλες. Εφαρμόζεται στις διαφορές κάθε ζεύγους.

t = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

Σε πολλά ζευγαρωμένα προβλήματα, η μηδενική τιμή είναι $\mu_{d,0} = 0$ , που σημαίνει ότι η μέση μεταβολή είναι μηδέν.

Πότε είναι κατάλληλο ένα t-test

Ένα t-test είναι κατάλληλη επιλογή όταν όλα τα παρακάτω ισχύουν περίπου:

Η μεταβλητή αποτελέσματος είναι αριθμητική.
Οι παρατηρήσεις είναι ανεξάρτητες μέσα στο επιλεγμένο σχέδιο, εκτός αν χρησιμοποιείς σκόπιμα ζευγαρωμένη διάταξη.
Το ερώτημα αφορά έναν μέσο ή μια διαφορά μέσων.
Το δείγμα δεν είναι τόσο μικρό και τόσο επηρεασμένο από ακραίες τιμές ή έντονη ασυμμετρία ώστε ο μέσος και η τυπική απόκλιση να γίνονται παραπλανητικοί.

Αν η τυπική απόκλιση του πληθυσμού ήταν γνωστή ακριβώς, η άμεση εναλλακτική σε ένα εγχειρίδιο θα ήταν το $z$ -test. Στην πράξη, τα t-tests είναι συνηθισμένα επειδή το $\sigma$ είναι συνήθως άγνωστο.

Λυμένο παράδειγμα: t-test ενός δείγματος

Έστω ότι μια διαδικασία συσκευασίας υποτίθεται ότι έχει μέσο όρο $100$ γραμμάρια. Παίρνεις ένα τυχαίο δείγμα $25$ συσκευασιών και βρίσκεις

\bar{x} = 102, \quad s = 4

Θέλεις να μάθεις αν ο πραγματικός μέσος διαφέρει από τα $100$ γραμμάρια.

Επειδή πρόκειται για ένα δείγμα που συγκρίνεται με μια τιμή στόχο, το σωστό τεστ είναι t-test ενός δείγματος.

Ξεκίνα με τις υποθέσεις:

H_0: \mu = 100

H_1: \mu \ne 100

Το τυπικό σφάλμα είναι

\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

Τώρα υπολόγισε το στατιστικό ελέγχου:

t = \frac{102 - 100}{0.8} = 2.5

Οι βαθμοί ελευθερίας είναι

df = n - 1 = 24

Για δίπλευρο έλεγχο με $df = 24$ , μια τιμή $t = 2.5$ δίνει p-value μικρότερο από $0.05$ . Αυτό σημαίνει ότι το αποτέλεσμα είναι στατιστικά σημαντικό στο επίπεδο $5\%$ , άρα απορρίπτεις την $H_0$ .

Στο πλαίσιο του προβλήματος, το δείγμα δίνει ενδείξεις ότι ο μέσος της διαδικασίας διαφέρει από τα $100$ γραμμάρια. Αυτό το συμπέρασμα εξαρτάται από το ότι το δείγμα είναι αρκετά ανεξάρτητο και δεν επηρεάζεται έντονα από ακραίες τιμές.

Συνηθισμένα λάθη στα t-tests

Ένα συνηθισμένο λάθος είναι η επιλογή της λάθος εκδοχής του τεστ. Αν οι ίδιοι άνθρωποι, μηχανές ή μονάδες μετρώνται δύο φορές, τα δεδομένα είναι ζευγαρωμένα, άρα ένα ανεξάρτητο t-test δύο δειγμάτων δεν είναι κατάλληλο.

Ένα άλλο λάθος είναι να διαβάζεται το «μη στατιστικά σημαντικό» ως «δεν υπάρχει διαφορά». Συνήθως σημαίνει ότι το δείγμα δεν έδωσε αρκετά ισχυρές ενδείξεις ενάντια στη μηδενική υπόθεση.

Ένα τρίτο λάθος είναι να παραλείπεται ο έλεγχος των δεδομένων. Με ένα πολύ μικρό δείγμα και μία ακραία τιμή, ο τύπος εξακολουθεί να δίνει έναν αριθμό, αλλά το συμπέρασμα μπορεί να μην είναι αξιόπιστο.

Πού χρησιμοποιούνται τα t-tests

Τα t-tests είναι συνηθισμένα σε πειράματα, στον ποιοτικό έλεγχο, στην ιατρική, στην ψυχολογία, στην εκπαίδευση και σε συγκρίσεις τύπου A/B όταν το αποτέλεσμα είναι αριθμητικό. Είναι ένα από τα βασικά σημεία εισόδου στη στατιστική συμπερασματολογία, επειδή συνδέουν τους μέσους όρους, τη μεταβλητότητα, την αβεβαιότητα και τη λήψη αποφάσεων μέσα σε μία μέθοδο.

Δοκιμάστε ένα παρόμοιο πρόβλημα

Άλλαξε το παράδειγμα ώστε ο δειγματικός μέσος να είναι $101$ αντί για $102$ , κρατώντας $n = 25$ και $s = 4$ . Υπολόγισε ξανά το στατιστικό t και αποφάσισε αν οι ενδείξεις παραμένουν αρκετά ισχυρές στο επίπεδο $5\%$ . Αυτό είναι ένα χρήσιμο επόμενο βήμα αν θέλεις να δεις πώς αλλάζει το συμπέρασμα καθώς ο δειγματικός μέσος πλησιάζει τη μηδενική τιμή.

Χρειάζεσαι βοήθεια με μια άσκηση;

Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.

Άνοιξε το GPAI Solver →