Ένας έλεγχος χι τετράγωνο εξετάζει αν τα κατηγορικά δεδομένα συχνοτήτων αποκλίνουν υπερβολικά από όσα θα περίμενε ένα μοντέλο μόνο λόγω τύχης. Χρησιμοποιείται για πλήθη σε κατηγορίες, όχι για μέσους όρους ή ακατέργαστες μετρήσεις.
Η βασική ιδέα είναι απλή: συγκρίνεις όσα παρατήρησες με όσα θα περίμενες αν ίσχυε η μηδενική υπόθεση. Αν οι αποκλίσεις είναι αρκετά μεγάλες, τότε το στατιστικό χι τετράγωνο γίνεται μεγάλο και τα δεδομένα θεωρούνται ένδειξη εναντίον αυτού του μηδενικού μοντέλου.
Τι Συγκρίνει Πραγματικά ο Έλεγχος
Στη συνηθέστερη περίπτωση, έχεις παρατηρούμενες συχνότητες και αναμενόμενες συχνότητες για κάθε κατηγορία. Το στατιστικό ελέγχου είναι
Αυτός ο αριθμός μεγαλώνει όταν οι παρατηρούμενες συχνότητες απομακρύνονται περισσότερο από τις αναμενόμενες. Οι μεγαλύτερες αποκλίσεις μετρούν περισσότερο, και οι κατηγορίες με μεγαλύτερες αναμενόμενες συχνότητες κλιμακώνονται ανάλογα.
Οι αναμενόμενες συχνότητες δεν επιλέγονται αυθαίρετα. Προκύπτουν από τη μηδενική υπόθεση. Σε έναν έλεγχο καλής προσαρμογής, η μηδενική υπόθεση μπορεί να λέει ότι οι κατηγορίες είναι εξίσου πιθανές. Σε έναν έλεγχο ανεξαρτησίας, η μηδενική υπόθεση λέει ότι δύο κατηγορικές μεταβλητές δεν σχετίζονται.
Δύο Συνηθισμένες Εκδοχές
Η φράση "έλεγχος χι τετράγωνο" συνήθως αναφέρεται σε μία από τις εξής περιπτώσεις:
- Έλεγχος καλής προσαρμογής, που εξετάζει αν μία κατηγορική μεταβλητή ακολουθεί μια υποτιθέμενη κατανομή.
- Έλεγχος ανεξαρτησίας, που εξετάζει αν δύο κατηγορικές μεταβλητές συνδέονται σε έναν πίνακα συνάφειας.
Η ίδια οικογένεια στατιστικών χρησιμοποιείται και στις δύο περιπτώσεις, αλλά ο τρόπος με τον οποίο υπολογίζεις τις αναμενόμενες συχνότητες εξαρτάται από την εκδοχή.
Λυμένο Παράδειγμα: Καλή Προσαρμογή
Ας υποθέσουμε ότι ένα καφέ θέλει να μάθει αν τρία μεγέθη ροφημάτων επιλέγονται εξίσου συχνά. Σε παραγγελίες, οι παρατηρούμενες συχνότητες είναι:
- Μικρό:
- Μεσαίο:
- Μεγάλο:
Αν η μηδενική υπόθεση λέει ότι και τα τρία μεγέθη είναι εξίσου πιθανά, τότε η αναμενόμενη συχνότητα σε κάθε κατηγορία είναι
Τώρα υπολόγισε το στατιστικό:
Αυτό είναι το στατιστικό ελέγχου, όχι από μόνο του το τελικό συμπέρασμα. Θα συνέκρινες το με μια κατανομή χι τετράγωνο με τους κατάλληλους βαθμούς ελευθερίας. Εδώ οι βαθμοί ελευθερίας είναι , επειδή υπάρχουν τρεις κατηγορίες και δεν εκτιμήθηκαν παράμετροι από τα δεδομένα. Με , ένα στατιστικό ίσο με δεν αποτελεί ισχυρή ένδειξη εναντίον της ίσης προτίμησης στο επίπεδο .
Η πρακτική ερμηνεία είναι η εξής: οι συχνότητες διαφέρουν από την τέλεια ισότητα, αλλά όχι τόσο ώστε να πούμε με βεβαιότητα ότι οι πραγματικές προτιμήσεις είναι άνισες μόνο με βάση αυτό το δείγμα.
Πότε Έχει Νόημα ο Έλεγχος
Χρησιμοποίησε έναν έλεγχο χι τετράγωνο όταν ισχύουν όλα τα παρακάτω:
- Τα δεδομένα σου είναι ένα σύνολο συχνοτήτων σε κατηγορίες.
- Οι παρατηρήσεις είναι ανεξάρτητες ή αρκετά κοντά σε αυτό για το μοντέλο που χρησιμοποιείς.
- Οι αναμενόμενες συχνότητες δεν είναι υπερβολικά μικρές για την προσέγγιση χι τετράγωνο που σκοπεύεις να χρησιμοποιήσεις.
Σε πολλές εισαγωγικές εφαρμογές, χρησιμοποιείται ο εμπειρικός κανόνας ότι οι αναμενόμενες συχνότητες πρέπει να είναι τουλάχιστον περίπου σε κάθε κατηγορία. Αυτό είναι μια πρακτική οδηγία, όχι ένας καθολικός νόμος, αλλά αποτελεί χρήσιμη προειδοποίηση.
Συνηθισμένα Λάθη
- Χρήση του ελέγχου σε μέσους όρους, μετρήσεις ή ποσοστά αντί για κατηγορικές συχνότητες.
- Αντιμετώπιση των παρατηρούμενων συχνοτήτων ως αναμενόμενων συχνοτήτων. Οι αναμενόμενες συχνότητες πρέπει να προκύπτουν από τη μηδενική υπόθεση.
- Παράβλεψη μικρών αναμενόμενων συχνοτήτων, κάτι που μπορεί να κάνει τη συνήθη προσέγγιση χι τετράγωνο αναξιόπιστη.
- Η σκέψη ότι το "στατιστικά σημαντικό" σημαίνει "σημαντικό στην πράξη". Ο έλεγχος εξετάζει μόνο τις ενδείξεις εναντίον του μηδενικού μοντέλου.
Πού Θα Το Δεις
Οι έλεγχοι χι τετράγωνο εμφανίζονται σε έρευνες, στη γενετική, στον ποιοτικό έλεγχο, στην έρευνα αγοράς και σε κάθε περίπτωση όπου τα αποτελέσματα χωρίζονται σε κατηγορίες. Είναι ιδιαίτερα συχνοί όταν το πραγματικό ερώτημα είναι αν ένα μοτίβο είναι απρόσμενο ή αν δύο κατηγορικές μεταβλητές φαίνεται να σχετίζονται.
Αν τα δεδομένα είναι αριθμητικά και όχι κατηγορικά, τότε συνήθως είναι καλύτερο ένα διαφορετικό εργαλείο. Για παράδειγμα, η σύγκριση μέσων όρων συχνά οδηγεί σε έλεγχο ή σε ANOVA.
Δοκίμασε τη Δική Σου Εκδοχή
Πάρε έναν μικρό πίνακα κατηγορικών συχνοτήτων και γράψε τη μηδενική υπόθεση πριν κάνεις οποιονδήποτε υπολογισμό. Αυτό το ένα βήμα συνήθως αποτρέπει το μεγαλύτερο λάθος στα προβλήματα χι τετράγωνο: να χρησιμοποιείς τον σωστό τύπο με λανθασμένες αναμενόμενες συχνότητες.
Χρειάζεσαι βοήθεια με μια άσκηση;
Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.
Άνοιξε το GPAI Solver →