Το ANOVA, συντομογραφία του analysis of variance (ανάλυση διακύμανσης), ελέγχει αν το μέσο αποτέλεσμα διαφέρει μεταξύ πολλών ομάδων. Στο one-way ANOVA, συγκρίνετε τη διακύμανση μεταξύ των μέσων των ομάδων με τη διακύμανση μέσα στις ομάδες, κάτι που παράγει το στατιστικό FF.

Συνήθως είναι το κατάλληλο εργαλείο όταν έχετε μία κατηγορική μεταβλητή ομαδοποίησης, μία ποσοτική μεταβλητή απόκρισης και θέλετε έναν συνολικό έλεγχο αντί να εκτελέσετε πολλά ξεχωριστά tt-tests. Αν η διακύμανση μεταξύ των ομάδων είναι μεγάλη σε σχέση με τη διακύμανση μέσα στις ομάδες, αυτό αποτελεί ένδειξη ότι δεν είναι όλοι οι μέσοι του πληθυσμού ίσοι.

Για ένα κλασικό one-way ANOVA, το στατιστικό ελέγχου είναι

F=MSBMSWF = \frac{MS_B}{MS_W}

όπου MSBMS_B είναι το μέσο τετράγωνο μεταξύ των ομάδων και MSWMS_W είναι το μέσο τετράγωνο μέσα στις ομάδες. Ένα μεγαλύτερο FF υποδηλώνει ότι οι μέσοι των ομάδων απέχουν περισσότερο απ’ όσο θα περιμένατε μόνο από τον συνηθισμένο ενδοομαδικό θόρυβο.

Τι Ελέγχει το ANOVA

Η συνήθης μηδενική υπόθεση για ένα one-way ANOVA είναι

H0:μ1=μ2==μkH_0: \mu_1 = \mu_2 = \cdots = \mu_k

Η εναλλακτική υπόθεση δεν είναι ότι «όλοι οι μέσοι είναι διαφορετικοί». Είναι ασθενέστερη: τουλάχιστον ένας μέσος ομάδας διαφέρει από τουλάχιστον έναν άλλο μέσο ομάδας.

Αυτό έχει σημασία, επειδή το ANOVA είναι ένας συνολικός έλεγχος. Ένα στατιστικά σημαντικό αποτέλεσμα λέει ότι υπάρχουν ενδείξεις κάποιας διαφοράς κάπου, αλλά δεν προσδιορίζει ποιες ομάδες διαφέρουν. Αυτό συνήθως απαιτεί συγκρίσεις παρακολούθησης.

Γιατί το ANOVA Χρησιμοποιεί τη Διακύμανση για να Συγκρίνει Μέσους

Το όνομα ακούγεται αρχικά παράδοξο. Αν το ANOVA αφορά μέσους, γιατί χρησιμοποιεί διακύμανση;

Επειδή η διακύμανση δίνει έναν καθαρό τρόπο να μετρηθούν δύο είδη διασποράς:

  1. Η διασπορά των μέσων των ομάδων γύρω από τον συνολικό μέσο.
  2. Η διασπορά των επιμέρους παρατηρήσεων γύρω από τον μέσο της δικής τους ομάδας.

Αν το πρώτο είδος διασποράς είναι πολύ μεγαλύτερο από το δεύτερο, τότε οι ομάδες φαίνονται πιο διαχωρισμένες απ’ όσο θα δημιουργούσε συνήθως η συνηθισμένη ενδοομαδική διακύμανση.

Πότε Είναι Κατάλληλο το One-Way ANOVA

Το one-way ANOVA χρησιμοποιείται όταν ένας κατηγορικός παράγοντας χωρίζει τις παρατηρήσεις σε ομάδες και θέλετε να συγκρίνετε τον μέσο μιας ποσοτικής μεταβλητής απόκρισης μεταξύ αυτών των ομάδων.

Παραδείγματα περιλαμβάνουν τη σύγκριση του μέσου βαθμού τεστ μεταξύ μεθόδων διδασκαλίας, της μέσης απόδοσης καλλιέργειας μεταξύ λιπασμάτων ή του μέσου χρόνου αντίδρασης μεταξύ πειραματικών συνθηκών.

Για το κλασικό one-way ANOVA, οι βασικές προϋποθέσεις είναι:

  1. Οι παρατηρήσεις είναι ανεξάρτητες.
  2. Η απόκριση μετριέται σε ποσοτική κλίμακα.
  3. Οι διακυμάνσεις των ομάδων είναι αρκετά παρόμοιες.
  4. Το μοντέλο δεν είναι σοβαρά ασύμβατο με τη μορφή των δεδομένων, ειδικά σε μικρά δείγματα.

Το ANOVA μπορεί να παραμένει αρκετά ανθεκτικό σε πολλές περιπτώσεις, ιδιαίτερα με ισομεγέθεις ομάδες και μέτρια μεγέθη δείγματος, αλλά αυτό εξαρτάται από τον σχεδιασμό. Αν τα δεδομένα είναι ζευγαρωμένα, επαναλαμβανόμενα στα ίδια άτομα ή έχουν έντονα άνισες διακυμάνσεις, το συνηθισμένο one-way ANOVA μπορεί να μην είναι το κατάλληλο εργαλείο.

Παράδειγμα One-Way ANOVA

Υποθέστε ότι ένας δάσκαλος θέλει να συγκρίνει τρεις μεθόδους μελέτης χρησιμοποιώντας βαθμολογίες από κουίζ:

  1. Μέθοδος A: 7272, 7474, 7676
  2. Μέθοδος B: 7878, 8080, 8282
  3. Μέθοδος C: 8484, 8686, 8888

Οι μέσοι των ομάδων είναι

xˉA=74,xˉB=80,xˉC=86\bar{x}_A = 74, \qquad \bar{x}_B = 80, \qquad \bar{x}_C = 86

Ο συνολικός μέσος και των 99 βαθμολογιών είναι

xˉ=80\bar{x} = 80

Τώρα χωρίστε τη διακύμανση σε δύο μέρη.

Βήμα 1: Διακύμανση Μεταξύ Ομάδων

Κάθε ομάδα έχει 33 παρατηρήσεις, οπότε το άθροισμα τετραγώνων μεταξύ ομάδων είναι

SSB=3(7480)2+3(8080)2+3(8680)2SS_B = 3(74-80)^2 + 3(80-80)^2 + 3(86-80)^2 SSB=3(36)+0+3(36)=216SS_B = 3(36) + 0 + 3(36) = 216

Με k=3k=3 ομάδες, οι βαθμοί ελευθερίας μεταξύ ομάδων είναι k1=2k-1=2, άρα

MSB=SSBk1=2162=108MS_B = \frac{SS_B}{k-1} = \frac{216}{2} = 108

Βήμα 2: Διακύμανση Εντός Ομάδων

Μέσα σε κάθε ομάδα, οι βαθμολογίες απέχουν μόνο 22 μονάδες από τον μέσο της ομάδας προς κάθε κατεύθυνση:

SSW=(4+0+4)+(4+0+4)+(4+0+4)=24SS_W = (4+0+4) + (4+0+4) + (4+0+4) = 24

Με N=9N=9 συνολικές παρατηρήσεις, οι βαθμοί ελευθερίας εντός ομάδων είναι Nk=6N-k=6, άρα

MSW=SSWNk=246=4MS_W = \frac{SS_W}{N-k} = \frac{24}{6} = 4

Βήμα 3: Υπολογισμός του Στατιστικού FF

Τώρα υπολογίστε

F=MSBMSW=1084=27F = \frac{MS_B}{MS_W} = \frac{108}{4} = 27

Μια τόσο μεγάλη τιμή του FF σημαίνει ότι οι μέσοι των ομάδων απέχουν πολύ μεταξύ τους σε σύγκριση με τη διακύμανση μέσα στις ομάδες. Κάτω από τις συνήθεις προϋποθέσεις του one-way ANOVA, αυτό αποτελεί ισχυρή ένδειξη κατά της μηδενικής υπόθεσης ότι και οι τρεις μέσοι του πληθυσμού είναι ίσοι.

Η πρακτική ερμηνεία είναι απλή: οι διαφορές μεταξύ των τριών μεθόδων μελέτης είναι πολύ μεγάλες για να αποδοθούν μόνο στη συνηθισμένη ενδοομαδική διασπορά.

Τι Δεν Σας Λέει το ANOVA

Το ANOVA δεν σας λέει ποιο συγκεκριμένο ζεύγος ομάδων διαφέρει. Μετά από ένα σημαντικό συνολικό αποτέλεσμα, συνήθως χρειάζεστε post-hoc συγκρίσεις ή προσχεδιασμένες αντιθέσεις.

Επίσης, δεν σας λέει ότι το αποτέλεσμα είναι σημαντικό με πρακτική έννοια. Μια στατιστικά ανιχνεύσιμη διαφορά μπορεί να είναι τόσο μικρή ώστε να μην έχει σημασία στην πραγματική εφαρμογή.

Αν η μελέτη δεν ήταν τυχαιοποιημένη, το ANOVA επίσης δεν αποδεικνύει ότι η μεταβλητή ομαδοποίησης προκάλεσε τη διαφορά. Απλώς ελέγχει αν οι μέσοι των ομάδων φαίνονται διαφορετικοί στα δεδομένα που συλλέξατε.

Συνηθισμένα Λάθη στο ANOVA

Ένα συνηθισμένο λάθος είναι να νομίζει κανείς ότι το ANOVA είναι κυρίως έλεγχος για το αν οι διακυμάνσεις των ομάδων είναι ίσες. Στη συνήθη χρήση του, το ANOVA συγκρίνει μέσους. Η διακύμανση εμφανίζεται επειδή είναι ο μηχανισμός που χρησιμοποιείται για να μετρηθεί το σήμα σε σχέση με τον θόρυβο.

Ένα άλλο λάθος είναι να εκτελούνται πολλά ξεχωριστά tt-tests αντί για ένα συνολικό ANOVA όταν εμπλέκονται πολλές ομάδες. Αυτό μπορεί να αυξήσει τον κίνδυνο ψευδώς θετικών αποτελεσμάτων, εκτός αν οι συγκρίσεις προσαρμοστούν προσεκτικά.

Ένα τρίτο λάθος είναι να σταματά κανείς μετά από ένα σημαντικό αποτέλεσμα ANOVA και να ισχυρίζεται ότι ξέρει ακριβώς ποια ομάδα υπερίσχυσε. Ο συνολικός έλεγχος δεν απαντά από μόνος του σε αυτό το ερώτημα.

Πού Χρησιμοποιείται το ANOVA

Το ANOVA είναι συνηθισμένο σε πειράματα, δοκιμές προϊόντων, εκπαίδευση, βιολογία, γεωργία και κοινωνικές επιστήμες. Είναι χρήσιμο όποτε χρειάζεστε έναν ενιαίο και τεκμηριωμένο έλεγχο για διαφορές μέσων μεταξύ πολλών ομάδων.

Είναι ιδιαίτερα χρήσιμο όταν το πραγματικό ερώτημα είναι συγκριτικό: παράγουν αυτές οι θεραπείες, οι μέθοδοι ή οι συνθήκες μετρήσιμα διαφορετικά μέσα αποτελέσματα;

Δοκιμάστε τη Δική Σας Εκδοχή

Πάρτε το ίδιο παράδειγμα και αλλάξτε τη Μέθοδο B σε 7979, 8080, 8181. Υπολογίστε ξανά τα SSWSS_W, MSWMS_W και το τελικό στατιστικό FF. Αυτή η μία αλλαγή κάνει ορατή τη βασική διαίσθηση: όσο αυξάνεται ο ενδοομαδικός θόρυβος, τόσο εξασθενεί η ένδειξη για πραγματική διαφορά μέσων.

Χρειάζεσαι βοήθεια με μια άσκηση;

Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.

Άνοιξε το GPAI Solver →