Έλεγχος Υποθέσεων

Ο έλεγχος υποθέσεων είναι ένας τρόπος να εξετάζουμε αν τα δεδομένα ενός δείγματος φαίνονται υπερβολικά ασύμβατα με έναν αρχικό ισχυρισμό. Αυτός ο αρχικός ισχυρισμός λέγεται μηδενική υπόθεση και γράφεται $H_0$ .

Η μέθοδος δεν αποδεικνύει ότι το $H_0$ είναι αληθές ή ψευδές. Θέτει ένα πιο περιορισμένο ερώτημα: αν το $H_0$ ήταν αληθές, θα ήταν αυτά τα τόσο ακραία δεδομένα αρκετά ασυνήθιστα ώστε να το αμφισβητήσουμε;

Η Βασική Ιδέα

Κάθε έλεγχος υποθέσεων έχει δύο ανταγωνιστικές δηλώσεις:

Τη μηδενική υπόθεση $H_0$ , που είναι ο αρχικός ισχυρισμός που ελέγχεται.
Την εναλλακτική υπόθεση $H_1$ ή $H_a$ , που είναι αυτό που θα υποστηρίζατε αν τα δεδομένα έδιναν αρκετές ενδείξεις κατά του $H_0$ .

Στη συνέχεια επιλέγετε ένα επίπεδο σημαντικότητας $\alpha$ , συχνά $0.05$ , πριν δείτε το αποτέλεσμα. Αυτό είναι το όριο για το πόσες ενδείξεις απαιτείτε πριν απορρίψετε το $H_0$ .

Δύο εκβάσεις είναι δυνατές:

Απορρίπτουμε το $H_0$ : τα δεδομένα είναι αρκετά ασύμβατα με το μηδενικό μοντέλο.
Δεν απορρίπτουμε το $H_0$ : τα δεδομένα δεν είναι αρκετά ισχυρά ώστε να αποκλείσουν το μηδενικό μοντέλο.

Το «δεν απορρίπτουμε» δεν είναι το ίδιο με το «το δεχόμαστε ως αληθές». Σημαίνει μόνο ότι το δείγμα δεν παρείχε αρκετά ισχυρές ενδείξεις κατά του $H_0$ .

Τα Συνήθη Βήματα

Η διαδικασία είναι συνήθως η εξής:

Διατυπώνετε καθαρά τα $H_0$ και $H_1$ .
Επιλέγετε το $\alpha$ και έναν έλεγχο που ταιριάζει στα δεδομένα και στις παραδοχές.
Υπολογίζετε ένα στατιστικό ελέγχου από το δείγμα.
Μετατρέπετε αυτό το στατιστικό σε $p$ -τιμή ή το συγκρίνετε με μια κρίσιμη τιμή.
Παίρνετε την απόφαση και την ερμηνεύετε μέσα στο πλαίσιο του προβλήματος.

Το στατιστικό ελέγχου εξαρτάται από την περίπτωση. Ο έλεγχος $z$ , ο έλεγχος $t$ , ο έλεγχος chi square και πολλοί άλλοι είναι όλα παραδείγματα ελέγχων υποθέσεων. Δεν υπάρχει ένας ενιαίος τύπος για όλο τον έλεγχο υποθέσεων.

Τι Σημαίνει Η $p$ -Τιμή

Η $p$ -τιμή είναι η πιθανότητα, με την υπόθεση ότι το $H_0$ είναι αληθές και ότι ισχύουν οι παραδοχές του ελέγχου, να προκύψει αποτέλεσμα τουλάχιστον τόσο ακραίο όσο αυτό που παρατηρήθηκε.

Μια μικρή $p$ -τιμή σημαίνει ότι τα δεδομένα θα ήταν ασυνήθιστα υπό το $H_0$ . Γι’ αυτό οι μικρές $p$ -τιμές θεωρούνται ένδειξη κατά της μηδενικής υπόθεσης.

Δεν σημαίνει:

Την πιθανότητα το $H_0$ να είναι ψευδές.
Την πιθανότητα το αποτέλεσμα να συνέβη «από τυχαία διακύμανση» με μια αόριστη καθημερινή έννοια.
Το μέγεθος ή τη σημασία της επίδρασης.

Κύριοι Τύποι Ελέγχων Υποθέσεων

Υπάρχουν δύο χρήσιμοι τρόποι να ομαδοποιήσουμε τους ελέγχους.

Ανά Κατεύθυνση

Ένας μονόπλευρος έλεγχος εξετάζει μεταβολή μόνο προς μία κατεύθυνση.

Δεξιόπλευρος: τιμές μεγαλύτερες από τον μηδενικό ισχυρισμό στηρίζουν το $H_1$ .
Αριστερόπλευρος: τιμές μικρότερες από τον μηδενικό ισχυρισμό στηρίζουν το $H_1$ .

Ένας δίπλευρος έλεγχος εξετάζει διαφορά προς οποιαδήποτε κατεύθυνση. Αν το $H_1$ είναι «δεν είναι ίσο», η περιοχή απόρριψης μοιράζεται και στις δύο ουρές.

Ανά Περίπτωση Δεδομένων

Ο έλεγχος $z$ χρησιμοποιείται σε ορισμένες περιπτώσεις ελέγχου μέσου όταν η τυπική απόκλιση του πληθυσμού είναι γνωστή ή όταν χρησιμοποιείται μια τεκμηριωμένη προσέγγιση μεγάλου δείγματος.
Ο έλεγχος $t$ είναι συνηθισμένος για μέσους όταν η τυπική απόκλιση του πληθυσμού είναι άγνωστη και οι συνθήκες είναι λογικές.
Ο έλεγχος chi square χρησιμοποιείται για κατηγορικά δεδομένα συχνοτήτων.

Ο σωστός έλεγχος εξαρτάται από τον τύπο της μεταβλητής, τον σχεδιασμό του δείγματος και τις παραδοχές. Συνηθισμένο λάθος είναι να επιλέγεται πρώτα ο τύπος και μετά το ερώτημα.

Λυμένο Παράδειγμα

Ας υποθέσουμε ότι μια μηχανή εμφιάλωσης πρέπει να δίνει κατά μέσο όρο $500$ mL ανά μπουκάλι. Μια ομάδα ποιοτικού ελέγχου παίρνει δείγμα $36$ μπουκαλιών και βρίσκει δειγματικό μέσο $496$ mL.

Υποθέστε, για αυτό το παράδειγμα, ότι η τυπική απόκλιση του πληθυσμού είναι γνωστή και ίση με $\sigma = 12$ mL και ότι οι συνθήκες δειγματοληψίας δικαιολογούν έναν μονοδειγματικό έλεγχο $z$ .

Διατυπώνουμε τις υποθέσεις:

H_0: \mu = 500

H_1: \mu < 500

Αυτός είναι αριστερόπλευρος έλεγχος, επειδή η ανησυχία είναι η υποπλήρωση.

Το τυπικό σφάλμα είναι

\frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{36}} = 2

Άρα το στατιστικό ελέγχου είναι

z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{496 - 500}{2} = -2

Αν $\alpha = 0.05$ για έναν αριστερόπλευρο έλεγχο $z$ , η κρίσιμη τιμή είναι περίπου $-1.645$ . Επειδή $-2 < -1.645$ , το αποτέλεσμα ανήκει στην περιοχή απόρριψης.

Άρα η απόφαση είναι να απορρίψουμε το $H_0$ στο επίπεδο $5\%$ . Στο συγκεκριμένο πλαίσιο, το δείγμα παρέχει ενδείξεις ότι η μηχανή υπογεμίζει κατά μέσο όρο.

Αυτό το συμπέρασμα εξαρτάται από τις παραδοχές του ελέγχου. Αν οι παραδοχές δεν είναι καλές, το συμπέρασμα μπορεί να είναι αναξιόπιστο ακόμη κι αν οι υπολογισμοί είναι σωστοί.

Σφάλματα Τύπου I Και Τύπου II

Ο έλεγχος υποθέσεων συνεπάγεται πάντα κίνδυνο σφάλματος.

Σφάλμα Τύπου I σημαίνει ότι απορρίπτουμε το $H_0$ ενώ είναι αληθές. Η πιθανότητά του ελέγχεται από το $\alpha$ .

Σφάλμα Τύπου II σημαίνει ότι δεν απορρίπτουμε το $H_0$ ενώ το $H_1$ είναι αληθές. Η πιθανότητά του συνήθως γράφεται $\beta$ .

Η μείωση του $\alpha$ κάνει τους ψευδείς συναγερμούς λιγότερο πιθανούς, αλλά μπορεί επίσης να δυσκολέψει την ανίχνευση πραγματικών επιδράσεων αν τίποτε άλλο δεν αλλάξει. Αυτός ο συμβιβασμός είναι ένας λόγος που το μέγεθος δείγματος έχει σημασία.

Συνηθισμένα Λάθη

Ένα συνηθισμένο λάθος είναι να λέμε ότι ένα μη στατιστικά σημαντικό αποτέλεσμα αποδεικνύει πως δεν υπάρχει επίδραση. Συνήθως δείχνει μόνο ότι τα δεδομένα δεν ήταν αρκετά ισχυρά για να την ανιχνεύσουν.

Άλλο λάθος είναι να αντιμετωπίζουμε τη στατιστική σημαντικότητα ως πρακτική σπουδαιότητα. Μια πολύ μικρή επίδραση μπορεί να είναι στατιστικά σημαντική σε ένα πολύ μεγάλο δείγμα.

Οι άνθρωποι επίσης κάνουν κακή χρήση των ελέγχων αγνοώντας παραδοχές για την ανεξαρτησία, το σχήμα της κατανομής, τη διασπορά ή τον τύπο των δεδομένων. Μια $p$ -τιμή που φαίνεται «καθαρή» δεν σώζει έναν ακατάλληλο έλεγχο.

Πότε Χρησιμοποιείται Ο Έλεγχος Υποθέσεων

Ο έλεγχος υποθέσεων χρησιμοποιείται στην επιστήμη, στη βιομηχανική παραγωγή, στην ιατρική, στις έρευνες, στα A/B tests και στην ανάλυση πολιτικής. Ο στόχος είναι συνήθως ο ίδιος: να αποφασίσουμε αν το δείγμα δίνει αρκετές ενδείξεις ώστε να αμφισβητήσουμε έναν αρχικό ισχυρισμό.

Στην πράξη, ένας σωστός έλεγχος δεν αφορά μόνο τον υπολογισμό. Απαιτεί επίσης μια λογική μηδενική υπόθεση, έναν υπερασπίσιμο σχεδιασμό και μια ερμηνεία που ταιριάζει με αυτό που ο έλεγχος μπορεί πραγματικά να πει.

Δοκίμασε Τη Δική Σου Εκδοχή

Πάρε το ίδιο παράδειγμα με τη μηχανή εμφιάλωσης, αλλά άλλαξε τον δειγματικό μέσο σε $498$ mL. Υπολόγισε ξανά το στατιστικό ελέγχου και δες αν η απόφαση αλλάζει για $\alpha = 0.05$ . Αυτός είναι ένας γρήγορος τρόπος να δεις πώς οι ενδείξεις γίνονται ισχυρότερες ή ασθενέστερες καθώς το αποτέλεσμα του δείγματος πλησιάζει τη μηδενική τιμή.

Χρειάζεσαι βοήθεια με μια άσκηση;

Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.

Άνοιξε το GPAI Solver →