Ο έλεγχος υποθέσεων είναι ένας τρόπος να εξετάζουμε αν τα δεδομένα ενός δείγματος φαίνονται υπερβολικά ασύμβατα με έναν αρχικό ισχυρισμό. Αυτός ο αρχικός ισχυρισμός λέγεται μηδενική υπόθεση και γράφεται H0H_0.

Η μέθοδος δεν αποδεικνύει ότι το H0H_0 είναι αληθές ή ψευδές. Θέτει ένα πιο περιορισμένο ερώτημα: αν το H0H_0 ήταν αληθές, θα ήταν αυτά τα τόσο ακραία δεδομένα αρκετά ασυνήθιστα ώστε να το αμφισβητήσουμε;

Η Βασική Ιδέα

Κάθε έλεγχος υποθέσεων έχει δύο ανταγωνιστικές δηλώσεις:

  1. Τη μηδενική υπόθεση H0H_0, που είναι ο αρχικός ισχυρισμός που ελέγχεται.
  2. Την εναλλακτική υπόθεση H1H_1 ή HaH_a, που είναι αυτό που θα υποστηρίζατε αν τα δεδομένα έδιναν αρκετές ενδείξεις κατά του H0H_0.

Στη συνέχεια επιλέγετε ένα επίπεδο σημαντικότητας α\alpha, συχνά 0.050.05, πριν δείτε το αποτέλεσμα. Αυτό είναι το όριο για το πόσες ενδείξεις απαιτείτε πριν απορρίψετε το H0H_0.

Δύο εκβάσεις είναι δυνατές:

  1. Απορρίπτουμε το H0H_0: τα δεδομένα είναι αρκετά ασύμβατα με το μηδενικό μοντέλο.
  2. Δεν απορρίπτουμε το H0H_0: τα δεδομένα δεν είναι αρκετά ισχυρά ώστε να αποκλείσουν το μηδενικό μοντέλο.

Το «δεν απορρίπτουμε» δεν είναι το ίδιο με το «το δεχόμαστε ως αληθές». Σημαίνει μόνο ότι το δείγμα δεν παρείχε αρκετά ισχυρές ενδείξεις κατά του H0H_0.

Τα Συνήθη Βήματα

Η διαδικασία είναι συνήθως η εξής:

  1. Διατυπώνετε καθαρά τα H0H_0 και H1H_1.
  2. Επιλέγετε το α\alpha και έναν έλεγχο που ταιριάζει στα δεδομένα και στις παραδοχές.
  3. Υπολογίζετε ένα στατιστικό ελέγχου από το δείγμα.
  4. Μετατρέπετε αυτό το στατιστικό σε pp-τιμή ή το συγκρίνετε με μια κρίσιμη τιμή.
  5. Παίρνετε την απόφαση και την ερμηνεύετε μέσα στο πλαίσιο του προβλήματος.

Το στατιστικό ελέγχου εξαρτάται από την περίπτωση. Ο έλεγχος zz, ο έλεγχος tt, ο έλεγχος chi square και πολλοί άλλοι είναι όλα παραδείγματα ελέγχων υποθέσεων. Δεν υπάρχει ένας ενιαίος τύπος για όλο τον έλεγχο υποθέσεων.

Τι Σημαίνει Η pp-Τιμή

Η pp-τιμή είναι η πιθανότητα, με την υπόθεση ότι το H0H_0 είναι αληθές και ότι ισχύουν οι παραδοχές του ελέγχου, να προκύψει αποτέλεσμα τουλάχιστον τόσο ακραίο όσο αυτό που παρατηρήθηκε.

Μια μικρή pp-τιμή σημαίνει ότι τα δεδομένα θα ήταν ασυνήθιστα υπό το H0H_0. Γι’ αυτό οι μικρές pp-τιμές θεωρούνται ένδειξη κατά της μηδενικής υπόθεσης.

Δεν σημαίνει:

  1. Την πιθανότητα το H0H_0 να είναι ψευδές.
  2. Την πιθανότητα το αποτέλεσμα να συνέβη «από τυχαία διακύμανση» με μια αόριστη καθημερινή έννοια.
  3. Το μέγεθος ή τη σημασία της επίδρασης.

Κύριοι Τύποι Ελέγχων Υποθέσεων

Υπάρχουν δύο χρήσιμοι τρόποι να ομαδοποιήσουμε τους ελέγχους.

Ανά Κατεύθυνση

Ένας μονόπλευρος έλεγχος εξετάζει μεταβολή μόνο προς μία κατεύθυνση.

  • Δεξιόπλευρος: τιμές μεγαλύτερες από τον μηδενικό ισχυρισμό στηρίζουν το H1H_1.
  • Αριστερόπλευρος: τιμές μικρότερες από τον μηδενικό ισχυρισμό στηρίζουν το H1H_1.

Ένας δίπλευρος έλεγχος εξετάζει διαφορά προς οποιαδήποτε κατεύθυνση. Αν το H1H_1 είναι «δεν είναι ίσο», η περιοχή απόρριψης μοιράζεται και στις δύο ουρές.

Ανά Περίπτωση Δεδομένων

  • Ο έλεγχος zz χρησιμοποιείται σε ορισμένες περιπτώσεις ελέγχου μέσου όταν η τυπική απόκλιση του πληθυσμού είναι γνωστή ή όταν χρησιμοποιείται μια τεκμηριωμένη προσέγγιση μεγάλου δείγματος.
  • Ο έλεγχος tt είναι συνηθισμένος για μέσους όταν η τυπική απόκλιση του πληθυσμού είναι άγνωστη και οι συνθήκες είναι λογικές.
  • Ο έλεγχος chi square χρησιμοποιείται για κατηγορικά δεδομένα συχνοτήτων.

Ο σωστός έλεγχος εξαρτάται από τον τύπο της μεταβλητής, τον σχεδιασμό του δείγματος και τις παραδοχές. Συνηθισμένο λάθος είναι να επιλέγεται πρώτα ο τύπος και μετά το ερώτημα.

Λυμένο Παράδειγμα

Ας υποθέσουμε ότι μια μηχανή εμφιάλωσης πρέπει να δίνει κατά μέσο όρο 500500 mL ανά μπουκάλι. Μια ομάδα ποιοτικού ελέγχου παίρνει δείγμα 3636 μπουκαλιών και βρίσκει δειγματικό μέσο 496496 mL.

Υποθέστε, για αυτό το παράδειγμα, ότι η τυπική απόκλιση του πληθυσμού είναι γνωστή και ίση με σ=12\sigma = 12 mL και ότι οι συνθήκες δειγματοληψίας δικαιολογούν έναν μονοδειγματικό έλεγχο zz.

Διατυπώνουμε τις υποθέσεις:

H0:μ=500H_0: \mu = 500 H1:μ<500H_1: \mu < 500

Αυτός είναι αριστερόπλευρος έλεγχος, επειδή η ανησυχία είναι η υποπλήρωση.

Το τυπικό σφάλμα είναι

σn=1236=2\frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{36}} = 2

Άρα το στατιστικό ελέγχου είναι

z=xˉμ0σ/n=4965002=2z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{496 - 500}{2} = -2

Αν α=0.05\alpha = 0.05 για έναν αριστερόπλευρο έλεγχο zz, η κρίσιμη τιμή είναι περίπου 1.645-1.645. Επειδή 2<1.645-2 < -1.645, το αποτέλεσμα ανήκει στην περιοχή απόρριψης.

Άρα η απόφαση είναι να απορρίψουμε το H0H_0 στο επίπεδο 5%5\%. Στο συγκεκριμένο πλαίσιο, το δείγμα παρέχει ενδείξεις ότι η μηχανή υπογεμίζει κατά μέσο όρο.

Αυτό το συμπέρασμα εξαρτάται από τις παραδοχές του ελέγχου. Αν οι παραδοχές δεν είναι καλές, το συμπέρασμα μπορεί να είναι αναξιόπιστο ακόμη κι αν οι υπολογισμοί είναι σωστοί.

Σφάλματα Τύπου I Και Τύπου II

Ο έλεγχος υποθέσεων συνεπάγεται πάντα κίνδυνο σφάλματος.

Σφάλμα Τύπου I σημαίνει ότι απορρίπτουμε το H0H_0 ενώ είναι αληθές. Η πιθανότητά του ελέγχεται από το α\alpha.

Σφάλμα Τύπου II σημαίνει ότι δεν απορρίπτουμε το H0H_0 ενώ το H1H_1 είναι αληθές. Η πιθανότητά του συνήθως γράφεται β\beta.

Η μείωση του α\alpha κάνει τους ψευδείς συναγερμούς λιγότερο πιθανούς, αλλά μπορεί επίσης να δυσκολέψει την ανίχνευση πραγματικών επιδράσεων αν τίποτε άλλο δεν αλλάξει. Αυτός ο συμβιβασμός είναι ένας λόγος που το μέγεθος δείγματος έχει σημασία.

Συνηθισμένα Λάθη

Ένα συνηθισμένο λάθος είναι να λέμε ότι ένα μη στατιστικά σημαντικό αποτέλεσμα αποδεικνύει πως δεν υπάρχει επίδραση. Συνήθως δείχνει μόνο ότι τα δεδομένα δεν ήταν αρκετά ισχυρά για να την ανιχνεύσουν.

Άλλο λάθος είναι να αντιμετωπίζουμε τη στατιστική σημαντικότητα ως πρακτική σπουδαιότητα. Μια πολύ μικρή επίδραση μπορεί να είναι στατιστικά σημαντική σε ένα πολύ μεγάλο δείγμα.

Οι άνθρωποι επίσης κάνουν κακή χρήση των ελέγχων αγνοώντας παραδοχές για την ανεξαρτησία, το σχήμα της κατανομής, τη διασπορά ή τον τύπο των δεδομένων. Μια pp-τιμή που φαίνεται «καθαρή» δεν σώζει έναν ακατάλληλο έλεγχο.

Πότε Χρησιμοποιείται Ο Έλεγχος Υποθέσεων

Ο έλεγχος υποθέσεων χρησιμοποιείται στην επιστήμη, στη βιομηχανική παραγωγή, στην ιατρική, στις έρευνες, στα A/B tests και στην ανάλυση πολιτικής. Ο στόχος είναι συνήθως ο ίδιος: να αποφασίσουμε αν το δείγμα δίνει αρκετές ενδείξεις ώστε να αμφισβητήσουμε έναν αρχικό ισχυρισμό.

Στην πράξη, ένας σωστός έλεγχος δεν αφορά μόνο τον υπολογισμό. Απαιτεί επίσης μια λογική μηδενική υπόθεση, έναν υπερασπίσιμο σχεδιασμό και μια ερμηνεία που ταιριάζει με αυτό που ο έλεγχος μπορεί πραγματικά να πει.

Δοκίμασε Τη Δική Σου Εκδοχή

Πάρε το ίδιο παράδειγμα με τη μηχανή εμφιάλωσης, αλλά άλλαξε τον δειγματικό μέσο σε 498498 mL. Υπολόγισε ξανά το στατιστικό ελέγχου και δες αν η απόφαση αλλάζει για α=0.05\alpha = 0.05. Αυτός είναι ένας γρήγορος τρόπος να δεις πώς οι ενδείξεις γίνονται ισχυρότερες ή ασθενέστερες καθώς το αποτέλεσμα του δείγματος πλησιάζει τη μηδενική τιμή.

Χρειάζεσαι βοήθεια με μια άσκηση;

Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.

Άνοιξε το GPAI Solver →