Τα μέτρα διασποράς δείχνουν πόσο απλωμένο είναι ένα σύνολο δεδομένων. Τα τρία βασικά μέτρα είναι το εύρος, η διακύμανση και η τυπική απόκλιση. Το εύρος χρησιμοποιεί μόνο τη μικρότερη και τη μεγαλύτερη τιμή, η διακύμανση μετρά τη μέση τετραγωνική απόσταση από τον μέσο όρο και η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης, οπότε εκφράζει τη διασπορά στις αρχικές μονάδες.
Αν θέλεις ένα γρήγορο συμπέρασμα, χρησιμοποίησε το εύρος για μια πρώτη ματιά, τη διακύμανση για πιο τυπική στατιστική εργασία και την τυπική απόκλιση όταν θέλεις ένα μέτρο διασποράς που ερμηνεύεται πιο εύκολα.
Εύρος, διακύμανση και τυπική απόκλιση με μια ματιά
Το εύρος είναι η απόσταση από την ελάχιστη έως τη μέγιστη τιμή:
Υπολογίζεται γρήγορα, αλλά χρησιμοποιεί μόνο δύο τιμές. Μία ακραία τιμή μπορεί να το αλλάξει πολύ.
Η διακύμανση μετρά πόσο μακριά τείνουν να βρίσκονται οι τιμές από τον μέσο όρο, αφού αυτές οι αποστάσεις υψωθούν στο τετράγωνο.
Για έναν ολόκληρο πληθυσμό,
Για ένα δείγμα που χρησιμοποιείται για την εκτίμηση ενός μεγαλύτερου πληθυσμού,
Χρησιμοποίησε το μόνο όταν τα δεδομένα σου είναι ολόκληρος ο πληθυσμός που σε ενδιαφέρει. Χρησιμοποίησε το όταν τα δεδομένα σου είναι δείγμα από μια μεγαλύτερη ομάδα.
Η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης:
ή, για ένα δείγμα,
Επειδή εκφράζεται στις αρχικές μονάδες, η τυπική απόκλιση είναι συνήθως πιο εύκολη στην ανάγνωση από τη διακύμανση.
Λυμένο παράδειγμα: ίδιο εύρος, διαφορετική διασπορά
Σύγκρινε τα παρακάτω δύο σύνολα δεδομένων:
- Σύνολο A:
- Σύνολο B:
Και τα δύο έχουν το ίδιο ελάχιστο, το ίδιο μέγιστο και τον ίδιο μέσο όρο.
Για κάθε σύνολο,
και
Άρα μόνο το εύρος λέει ότι έχουν το ίδιο άνοιγμα. Όμως οι τιμές είναι κατανεμημένες διαφορετικά γύρω από τον μέσο όρο.
Σύνολο A
Οι αποκλίσεις από τον μέσο όρο είναι
Αν τις υψώσουμε στο τετράγωνο, παίρνουμε
Το άθροισμα των τετραγώνων των αποκλίσεων είναι . Αν θεωρήσουμε τα δεδομένα ως πληθυσμό,
και
Σύνολο B
Οι αποκλίσεις από τον μέσο όρο είναι
Αν τις υψώσουμε στο τετράγωνο, παίρνουμε
Το άθροισμα των τετραγώνων των αποκλίσεων είναι , άρα
και
Και τα δύο σύνολα έχουν το ίδιο εύρος, αλλά το Σύνολο B έχει μεγαλύτερη διακύμανση και τυπική απόκλιση. Αυτή είναι η βασική ιδέα: το εύρος βλέπει μόνο τα άκρα, ενώ η διακύμανση και η τυπική απόκλιση χρησιμοποιούν ολόκληρο το σύνολο δεδομένων.
Συνηθισμένα λάθη στα μέτρα διασποράς
Ένα συνηθισμένο λάθος είναι να υποθέτουμε ότι το ίδιο εύρος σημαίνει και ίδια διασπορά. Το παραπάνω παράδειγμα δείχνει γιατί αυτό είναι λάθος.
Ένα άλλο λάθος είναι να αντιμετωπίζουμε τη διακύμανση σαν να εκφράζεται στις αρχικές μονάδες. Δεν ισχύει αυτό. Αν τα δεδομένα είναι σε μέτρα, η διακύμανση είναι σε τετραγωνικά μέτρα.
Ένα τρίτο λάθος είναι η σύγχυση ανάμεσα στους τύπους για πληθυσμό και δείγμα. Ο σωστός παρονομαστής εξαρτάται από την περίπτωση: χρησιμοποίησε για ολόκληρο πληθυσμό και για δείγμα.
Βοηθά επίσης να θυμάσαι ότι η διακύμανση και η τυπική απόκλιση είναι ευαίσθητες στις ακραίες τιμές, επειδή οι μεγάλες αποκλίσεις υψώνονται στο τετράγωνο πριν υπολογιστεί ο μέσος όρος.
Πότε είναι χρήσιμο κάθε μέτρο
Χρησιμοποίησε το εύρος όταν θέλεις μια γρήγορη πρώτη εικόνα για το πόσο εκτείνονται τα δεδομένα.
Χρησιμοποίησε τη διακύμανση όταν χρειάζεσαι το μέτρο διασποράς μέσα σε άλλες στατιστικές μεθόδους. Πολλοί τύποι στην πιθανότητα και τη στατιστική βασίζονται στη διακύμανση, ακόμη κι όταν στις τελικές αναφορές εμφανίζεται η τυπική απόκλιση.
Χρησιμοποίησε την τυπική απόκλιση όταν θέλεις μια πρακτική περιγραφή της διασποράς στις ίδιες μονάδες με τα δεδομένα. Σε πολλές σχολικές και πραγματικές εφαρμογές, είναι η πιο ευανάγνωστη επιλογή.
Δοκίμασε ένα παρόμοιο πρόβλημα
Φτιάξε δύο μικρά σύνολα δεδομένων με τον ίδιο μέσο όρο και το ίδιο εύρος και μετά σύγκρινε τη διακύμανση και την τυπική τους απόκλιση. Αν θέλεις ένα επόμενο βήμα, δοκίμασε τη δική σου εκδοχή σε έναν επιλύτη αφού πρώτα τη λύσεις με το χέρι.
Χρειάζεσαι βοήθεια με μια άσκηση;
Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.
Άνοιξε το GPAI Solver →