Η κανονική κατανομή είναι ένα μοντέλο πιθανότητας σε σχήμα καμπάνας, όπου οι τιμές κοντά στον μέσο όρο εμφανίζονται συχνότερα και οι πιο απομακρυσμένες τιμές εμφανίζονται λιγότερο συχνά με συμμετρικό τρόπο. Αν προσπαθείς να καταλάβεις την καμπύλη καμπάνας, το z-score ή τον τύπο της κανονικής κατανομής, η βασική ιδέα είναι απλή: ο μέσος όρος καθορίζει το κέντρο και η τυπική απόκλιση καθορίζει την έκταση.
Αυτό το μοντέλο είναι χρήσιμο μόνο όταν το κανονικό σχήμα ταιριάζει λογικά στα δεδομένα ή στην κατάσταση. Όταν αυτή η συνθήκη ισχύει, μπορείς να εκτιμήσεις τυπικά διαστήματα, να συγκρίνεις τιμές με z-score και να ερμηνεύσεις πόσο ασυνήθιστο είναι ένα αποτέλεσμα.
Τι σημαίνει η καμπύλη καμπάνας
Αν μια μεταβλητή ακολουθεί κανονική κατανομή, οι τιμές κοντά στον μέσο όρο είναι πιο συχνές από τις τιμές που βρίσκονται μακριά. Η αριστερή και η δεξιά πλευρά είναι κατοπτρικές, οπότε το να βρίσκεσαι τυπικές αποκλίσεις πάνω από τον μέσο όρο είναι εξίσου ασυνήθιστο με το να βρίσκεσαι τυπικές αποκλίσεις κάτω από αυτόν.
Συχνά θα δεις τη σημειογραφία
Αυτό σημαίνει ότι η τυχαία μεταβλητή μοντελοποιείται ως κανονική με μέσο όρο και διακύμανση . Αφού η διακύμανση είναι , η τυπική απόκλιση είναι , όπου .
Ο τύπος της κανονικής κατανομής, με απλά λόγια
Ο τύπος της πυκνότητας της κανονικής κατανομής είναι
Δεν χρειάζεται να απομνημονεύσεις κάθε μέρος του τύπου για να χρησιμοποιήσεις σωστά την ιδέα. Αυτό που έχει μεγαλύτερη σημασία είναι ότι το μετακινεί την καμπύλη αριστερά ή δεξιά, ενώ το την κάνει πιο στενή ή πιο πλατιά.
Αυτός ο τύπος περιγράφει πυκνότητα, όχι την πιθανότητα μιας ακριβώς συγκεκριμένης τιμής. Σε ένα συνεχές μοντέλο, οι πιθανότητες προκύπτουν από διαστήματα όπως ή .
Πώς συνδέονται ο μέσος όρος, η τυπική απόκλιση και το z-score
Η αλλαγή του μέσου όρου μετακινεί την καμπύλη αριστερά ή δεξιά. Η αλλαγή της τυπικής απόκλισης κάνει την καμπύλη πιο στενή ή πιο πλατιά. Ένα μικρό σημαίνει ότι οι τιμές είναι συγκεντρωμένες κοντά στον μέσο όρο. Ένα μεγαλύτερο σημαίνει ότι είναι πιο απλωμένες.
Για να συγκρίνεις μία τιμή με την υπόλοιπη κατανομή, χρησιμοποίησε το z-score:
Αυτό σου δείχνει τη σχετική θέση σε μονάδες τυπικής απόκλισης. Αν , η τιμή είναι τυπικές αποκλίσεις πάνω από τον μέσο όρο. Αν , είναι τυπικές αποκλίσεις κάτω από τον μέσο όρο.
Για ένα κανονικό μοντέλο, ένας πρακτικός σύντομος κανόνας είναι ο εμπειρικός κανόνας:
Χρησιμοποίησέ τον μόνο όταν ένα κανονικό μοντέλο είναι πράγματι λογικό. Είναι μια χρήσιμη προσέγγιση, όχι εγγύηση για κάθε πραγματικό σύνολο δεδομένων.
Λυμένο παράδειγμα με z-score και καμπύλη καμπάνας
Έστω ότι οι βαθμολογίες ενός διαγωνίσματος μοντελοποιούνται από
Άρα ο μέσος βαθμός είναι και η τυπική απόκλιση είναι .
Πρώτα, χρησιμοποίησε τον εμπειρικό κανόνα. Περίπου το των βαθμών πρέπει να βρίσκεται μέσα σε μία τυπική απόκλιση από τον μέσο όρο:
Άρα το γρήγορο διάστημα είναι
Περίπου το των βαθμών πρέπει να βρίσκεται μέσα σε δύο τυπικές αποκλίσεις:
Άρα αυτό το διάστημα είναι
Τώρα πάρε έναν μαθητή που έγραψε . Το z-score είναι
Αυτό σημαίνει ότι ο βαθμός είναι τυπικές αποκλίσεις πάνω από τον μέσο όρο. Αυτή είναι η πιο γρήγορη χρήσιμη ερμηνεία: ο βαθμός είναι ξεκάθαρα πάνω από τον μέσο όρο, αλλά όχι υπερβολικά βαθιά στην ουρά.
Συνηθισμένα λάθη σε ασκήσεις κανονικής κατανομής
Να θεωρείς κάθε καμπανοειδές γράφημα κανονικό
Μερικά δεδομένα είναι ασύμμετρα, έχουν βαριές ουρές ή έχουν πολλές κορυφές. Σε αυτές τις περιπτώσεις, ένα κανονικό μοντέλο μπορεί να ταιριάζει άσχημα, ακόμη κι αν το γράφημα φαίνεται περίπου στρογγυλεμένο.
Να μπερδεύεις την πυκνότητα με την πιθανότητα
Ο τύπος δεν είναι η πιθανότητα ότι το ισούται με έναν ακριβώς συγκεκριμένο αριθμό. Στις συνεχείς κατανομές, η πιθανότητα σε ένα ακριβές σημείο είναι , οπότε δουλεύεις με διαστήματα.
Να χρησιμοποιείς τον εμπειρικό κανόνα χωρίς να ελέγχεις το μοντέλο
Ο κανόνας -- ανήκει στην κανονική κατανομή. Δεν πρέπει να εφαρμόζεται αυτόματα σε οποιοδήποτε σύνολο δεδομένων.
Να συγχέεις τη διακύμανση με την τυπική απόκλιση
Η διακύμανση είναι . Το z-score χρησιμοποιεί το , όχι το .
Πότε χρησιμοποιείται η κανονική κατανομή
Η κανονική κατανομή εμφανίζεται συχνά όταν οι μετρήσεις συγκεντρώνονται γύρω από μια κεντρική τιμή και οι ακραίες τιμές είναι σχετικά σπάνιες. Είναι συνηθισμένη σε μοντέλα σφάλματος μέτρησης, στην ερμηνεία βαθμολογιών, στον ποιοτικό έλεγχο και στη μελέτη των δειγματικών μέσων.
Αυτό δεν σημαίνει ότι όλα τα πραγματικά δεδομένα είναι κανονικά. Σημαίνει ότι το κανονικό μοντέλο είναι μια χρήσιμη προσέγγιση όταν το σχήμα, το πλαίσιο και οι υποθέσεις κάνουν αυτή την προσέγγιση λογική.
Δοκίμασε ένα παρόμοιο πρόβλημα
Άλλαξε το παράδειγμα σε και υπολόγισε το z-score του . Έπειτα βρες το διάστημα που καλύπτει περίπου το των τιμών. Αν δοκιμάσεις τη δική σου εκδοχή με διαφορετικό μέσο όρο ή διαφορετική τυπική απόκλιση, θα δεις καλύτερα πώς αλλάζει η καμπύλη καμπάνας.
Χρειάζεσαι βοήθεια με μια άσκηση;
Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.
Άνοιξε το GPAI Solver →