Ένα διάγραμμα κουτιού και απολήξεων δείχνει με μια ματιά το κέντρο, τη διασπορά και την πιθανή ασυμμετρία ενός συνόλου δεδομένων. Κατασκευάζεται από την πενταριθμική σύνοψη: ελάχιστο, πρώτο τεταρτημόριο , διάμεσος, τρίτο τεταρτημόριο και μέγιστο. Αν στην τάξη σας ή στο λογισμικό σας χρησιμοποιείται ο κανόνας , οι απολήξεις μπορεί να σταματούν στις πιο ακραίες μη ακραίες τιμές αντί για το απόλυτο ελάχιστο και μέγιστο.
Το κουτί εκτείνεται από το έως το , άρα περιέχει το μεσαίο των δεδομένων. Η γραμμή μέσα στο κουτί είναι η διάμεσος. Οι απολήξεις δείχνουν πόσο εκτείνονται τα δεδομένα πέρα από αυτό το μεσαίο μισό.
Τι δείχνει ένα διάγραμμα κουτιού και απολήξεων
Ένα box plot σε βοηθά να απαντήσεις γρήγορα σε τρεις ερωτήσεις:
- Πού βρίσκεται το κέντρο; Κοίτα τη διάμεσο.
- Πόσο απλωμένο είναι το μεσαίο μισό; Κοίτα το πλάτος του κουτιού.
- Είναι ισορροπημένες οι ουρές; Σύγκρινε τις δύο απολήξεις.
Το πλάτος του κουτιού είναι το ενδοτεταρτημοριακό εύρος, δηλαδή . Μεγαλύτερο σημαίνει ότι το μεσαίο μισό των δεδομένων είναι πιο απλωμένο. Αν η μία απόληξη είναι πολύ μεγαλύτερη από την άλλη, τα δεδομένα μπορεί να έχουν ασυμμετρία προς εκείνη την κατεύθυνση.
Πολλά box plots χρησιμοποιούν επίσης τον κανόνα για να επισημάνουν πιθανές ακραίες τιμές. Σε αυτή την εκδοχή, οι απολήξεις σταματούν στις πιο ακραίες μη ακραίες τιμές. Γι’ αυτό δύο σωστά box plots για τα ίδια δεδομένα μπορεί να φαίνονται λίγο διαφορετικά, αν χρησιμοποιούν διαφορετικούς κανόνες για τις απολήξεις.
Λυμένο παράδειγμα από τα δεδομένα στο box plot
Χρησιμοποίησε το ταξινομημένο σύνολο δεδομένων
Υπάρχουν τιμές, άρα η διάμεσος είναι ο μέσος όρος των δύο μεσαίων τιμών:
Επειδή υπάρχει άρτιος αριθμός δεδομένων, χωρίζουμε τη λίστα σε δύο ίσα μισά. Το κάτω μισό είναι , άρα
Το πάνω μισό είναι , άρα
Αυτό δίνει την πενταριθμική σύνοψη:
Τώρα υπολόγισε το ενδοτεταρτημοριακό εύρος:
Αν χρησιμοποιήσεις τον συνηθισμένο κανόνα ακραίων τιμών , τα όρια είναι
και
Όλες οι τιμές των δεδομένων βρίσκονται μεταξύ και , άρα δεν υπάρχουν πιθανές ακραίες τιμές με αυτόν τον κανόνα. Για αυτό το σύνολο δεδομένων, το κουτί θα εκτεινόταν από το έως το , η γραμμή της διαμέσου θα ήταν στο και οι απολήξεις θα έφταναν στο και στο .
Πώς να διαβάζεις γρήγορα ένα box plot
Ξεκίνα από τη γραμμή της διαμέσου. Αυτή σου δείχνει πού βρίσκεται το κέντρο των δεδομένων.
Έπειτα σύγκρινε το πλάτος του κουτιού και τα μήκη των απολήξεων. Το κουτί δείχνει πού βρίσκεται το μεσαίο των τιμών, ενώ οι απολήξεις δείχνουν πόσο εκτείνονται οι ουρές πέρα από αυτή την περιοχή.
Τέλος, αναζήτησε ασυμμετρία. Αν η διάμεσος δεν είναι στο κέντρο του κουτιού ή αν η μία απόληξη είναι πολύ μεγαλύτερη από την άλλη, η κατανομή μπορεί να μην είναι ισορροπημένη γύρω από το κέντρο.
Συνηθισμένα λάθη στα διαγράμματα κουτιού και απολήξεων
Ένα συνηθισμένο λάθος είναι να διαβάζονται τα άκρα του κουτιού ως το ελάχιστο και το μέγιστο. Συνήθως παριστάνουν τα και , όχι τα άκρα ολόκληρου του συνόλου δεδομένων.
Ένα άλλο λάθος είναι να θεωρείται ότι κάθε box plot χρησιμοποιεί τον ίδιο κανόνα για τις απολήξεις. Σε μερικά, οι απολήξεις φτάνουν στο ελάχιστο και στο μέγιστο. Σε άλλα, σταματούν στις πιο ακραίες μη ακραίες τιμές.
Είναι επίσης εύκολο να ξεχάσεις ότι τα τεταρτημόρια εξαρτώνται από ταξινομημένα δεδομένα. Αν οι τιμές δεν μπουν πρώτα σε σειρά, τα τεταρτημόρια και η διάμεσος θα είναι λανθασμένα.
Πότε είναι χρήσιμα τα box plots
Τα διαγράμματα κουτιού και απολήξεων είναι χρήσιμα όταν θέλεις μια γρήγορη σύνοψη μιας κατανομής αντί για μια πλήρη λίστα τιμών. Είναι συνηθισμένα στα μαθήματα στατιστικής, στις περιλήψεις πειραμάτων, στον ποιοτικό έλεγχο και στις συγκρίσεις μεταξύ ομάδων.
Είναι ιδιαίτερα χρήσιμα όταν οι ακραίες τιμές ή η ασυμμετρία έχουν σημασία, επειδή η διάμεσος και τα τεταρτημόρια είναι συνήθως πιο σταθερά από τον μέσο όρο μόνος του.
Δοκίμασε ένα παρόμοιο σύνολο δεδομένων
Πάρε ένα μικρό ταξινομημένο σύνολο δεδομένων, γράψε την πενταριθμική σύνοψή του και σχεδίασε το κουτί πριν ασχοληθείς με τις ακραίες τιμές. Αν θέλεις να ελέγξεις τα τεταρτημόρια και τη διάμεσό σου σε ένα παρόμοιο πρόβλημα στατιστικής, δοκίμασε τη δική σου εκδοχή σε έναν solver αφού πρώτα φτιάξεις μόνος σου την ταξινομημένη λίστα.
Χρειάζεσαι βοήθεια με μια άσκηση;
Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.
Άνοιξε το GPAI Solver →