Ένα t-test σε βοηθά να αποφασίσεις αν ένας δειγματικός μέσος, ή η διαφορά ανάμεσα σε δύο δειγματικούς μέσους, είναι μεγαλύτερη από ό,τι θα περίμενες μόνο από την τυχαία μεταβλητότητα. Το χρησιμοποιείς όταν η μεταβλητή αποτελέσματος είναι αριθμητική και η τυπική απόκλιση του πληθυσμού είναι άγνωστη, κάτι που είναι η συνηθισμένη περίπτωση στην πράξη.

Η βασική προϋπόθεση είναι ότι το τεστ πρέπει να ταιριάζει με το σχέδιο των δεδομένων. Ένα t-test χρησιμοποιείται για ερωτήματα σχετικά με μέσους όρους, όχι για κατηγορικές συχνότητες, και πολύ μικρά δείγματα χρειάζονται προσοχή αν έχουν έντονη ασυμμετρία ή εμφανείς ακραίες τιμές.

Τι μετρά ένα t-test

Η βασική ιδέα είναι πάντα η ίδια:

t=observed differenceestimated standard errort = \frac{\text{observed difference}}{\text{estimated standard error}}

Το στατιστικό γίνεται μεγαλύτερο όταν η διαφορά των μέσων είναι μεγάλη, και μικρότερο όταν τα δεδομένα έχουν πολύ θόρυβο ή το δείγμα είναι μικρό.

Κάτω από τη μηδενική υπόθεση, και αν οι συνθήκες είναι λογικές, αυτό το στατιστικό ακολουθεί κατανομή tt και όχι την κανονική κατανομή zz. Η κατανομή tt έχει βαρύτερες ουρές, ειδικά για μικρά δείγματα, οπότε είναι πιο συντηρητική στο να χαρακτηρίσει ένα αποτέλεσμα ως στατιστικά σημαντικό.

Ποιον τύπο t-test πρέπει να χρησιμοποιήσετε

t-test ενός δείγματος

Χρησιμοποίησέ το όταν έχεις ένα δείγμα και θέλεις να συγκρίνεις τον μέσο του με μια τιμή αναφοράς μ0\mu_0.

t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

Παράδειγμα: σύγκρινε το μέσο βάρος συσκευασιών σε ένα δείγμα με έναν στόχο 100100 γραμμαρίων.

t-test δύο δειγμάτων

Χρησιμοποίησέ το όταν θέλεις να συγκρίνεις τους μέσους δύο ανεξάρτητων ομάδων, όπως δύο τάξεις που διδάχθηκαν με διαφορετικές μεθόδους.

Αν δεν έχεις ισχυρό λόγο να υποθέσεις ίσες διακυμάνσεις στους πληθυσμούς, το t-test του Welch είναι συνήθως η ασφαλέστερη προεπιλογή:

t=xˉ1xˉ2s12n1+s22n2t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

Οι βαθμοί ελευθερίας για το τεστ του Welch δεν είναι απλώς n1+n22n_1 + n_2 - 2, οπότε αυτό το μέρος το αναλαμβάνει συνήθως το λογισμικό.

Ζευγαρωμένο t-test

Χρησιμοποίησέ το για δεδομένα πριν-και-μετά ή για αντιστοιχισμένα ζεύγη. Το τεστ δεν εφαρμόζεται ξεχωριστά στις δύο αρχικές στήλες. Εφαρμόζεται στις διαφορές κάθε ζεύγους.

t=dˉμd,0sd/nt = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

Σε πολλά ζευγαρωμένα προβλήματα, η μηδενική τιμή είναι μd,0=0\mu_{d,0} = 0, που σημαίνει ότι η μέση μεταβολή είναι μηδέν.

Πότε είναι κατάλληλο ένα t-test

Ένα t-test είναι κατάλληλη επιλογή όταν όλα τα παρακάτω ισχύουν περίπου:

  1. Η μεταβλητή αποτελέσματος είναι αριθμητική.
  2. Οι παρατηρήσεις είναι ανεξάρτητες μέσα στο επιλεγμένο σχέδιο, εκτός αν χρησιμοποιείς σκόπιμα ζευγαρωμένη διάταξη.
  3. Το ερώτημα αφορά έναν μέσο ή μια διαφορά μέσων.
  4. Το δείγμα δεν είναι τόσο μικρό και τόσο επηρεασμένο από ακραίες τιμές ή έντονη ασυμμετρία ώστε ο μέσος και η τυπική απόκλιση να γίνονται παραπλανητικοί.

Αν η τυπική απόκλιση του πληθυσμού ήταν γνωστή ακριβώς, η άμεση εναλλακτική σε ένα εγχειρίδιο θα ήταν το zz-test. Στην πράξη, τα t-tests είναι συνηθισμένα επειδή το σ\sigma είναι συνήθως άγνωστο.

Λυμένο παράδειγμα: t-test ενός δείγματος

Έστω ότι μια διαδικασία συσκευασίας υποτίθεται ότι έχει μέσο όρο 100100 γραμμάρια. Παίρνεις ένα τυχαίο δείγμα 2525 συσκευασιών και βρίσκεις

xˉ=102,s=4\bar{x} = 102, \quad s = 4

Θέλεις να μάθεις αν ο πραγματικός μέσος διαφέρει από τα 100100 γραμμάρια.

Επειδή πρόκειται για ένα δείγμα που συγκρίνεται με μια τιμή στόχο, το σωστό τεστ είναι t-test ενός δείγματος.

Ξεκίνα με τις υποθέσεις:

H0:μ=100H_0: \mu = 100 H1:μ100H_1: \mu \ne 100

Το τυπικό σφάλμα είναι

sn=425=45=0.8\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

Τώρα υπολόγισε το στατιστικό ελέγχου:

t=1021000.8=2.5t = \frac{102 - 100}{0.8} = 2.5

Οι βαθμοί ελευθερίας είναι

df=n1=24df = n - 1 = 24

Για δίπλευρο έλεγχο με df=24df = 24, μια τιμή t=2.5t = 2.5 δίνει p-value μικρότερο από 0.050.05. Αυτό σημαίνει ότι το αποτέλεσμα είναι στατιστικά σημαντικό στο επίπεδο 5%5\%, άρα απορρίπτεις την H0H_0.

Στο πλαίσιο του προβλήματος, το δείγμα δίνει ενδείξεις ότι ο μέσος της διαδικασίας διαφέρει από τα 100100 γραμμάρια. Αυτό το συμπέρασμα εξαρτάται από το ότι το δείγμα είναι αρκετά ανεξάρτητο και δεν επηρεάζεται έντονα από ακραίες τιμές.

Συνηθισμένα λάθη στα t-tests

Ένα συνηθισμένο λάθος είναι η επιλογή της λάθος εκδοχής του τεστ. Αν οι ίδιοι άνθρωποι, μηχανές ή μονάδες μετρώνται δύο φορές, τα δεδομένα είναι ζευγαρωμένα, άρα ένα ανεξάρτητο t-test δύο δειγμάτων δεν είναι κατάλληλο.

Ένα άλλο λάθος είναι να διαβάζεται το «μη στατιστικά σημαντικό» ως «δεν υπάρχει διαφορά». Συνήθως σημαίνει ότι το δείγμα δεν έδωσε αρκετά ισχυρές ενδείξεις ενάντια στη μηδενική υπόθεση.

Ένα τρίτο λάθος είναι να παραλείπεται ο έλεγχος των δεδομένων. Με ένα πολύ μικρό δείγμα και μία ακραία τιμή, ο τύπος εξακολουθεί να δίνει έναν αριθμό, αλλά το συμπέρασμα μπορεί να μην είναι αξιόπιστο.

Πού χρησιμοποιούνται τα t-tests

Τα t-tests είναι συνηθισμένα σε πειράματα, στον ποιοτικό έλεγχο, στην ιατρική, στην ψυχολογία, στην εκπαίδευση και σε συγκρίσεις τύπου A/B όταν το αποτέλεσμα είναι αριθμητικό. Είναι ένα από τα βασικά σημεία εισόδου στη στατιστική συμπερασματολογία, επειδή συνδέουν τους μέσους όρους, τη μεταβλητότητα, την αβεβαιότητα και τη λήψη αποφάσεων μέσα σε μία μέθοδο.

Δοκιμάστε ένα παρόμοιο πρόβλημα

Άλλαξε το παράδειγμα ώστε ο δειγματικός μέσος να είναι 101101 αντί για 102102, κρατώντας n=25n = 25 και s=4s = 4. Υπολόγισε ξανά το στατιστικό t και αποφάσισε αν οι ενδείξεις παραμένουν αρκετά ισχυρές στο επίπεδο 5%5\%. Αυτό είναι ένα χρήσιμο επόμενο βήμα αν θέλεις να δεις πώς αλλάζει το συμπέρασμα καθώς ο δειγματικός μέσος πλησιάζει τη μηδενική τιμή.

Χρειάζεσαι βοήθεια με μια άσκηση;

Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.

Άνοιξε το GPAI Solver →