Η διωνυμική κατανομή σου δίνει την πιθανότητα να προκύψουν ακριβώς kk επιτυχίες σε nn δοκιμές. Τη χρησιμοποιείς μόνο όταν κάθε δοκιμή έχει δύο εκβάσεις για το γεγονός που σε ενδιαφέρει, οι δοκιμές είναι ανεξάρτητες και η πιθανότητα επιτυχίας παραμένει ίδια κάθε φορά.

Αν αποτύχει μία από αυτές τις προϋποθέσεις, οι υπολογισμοί μπορεί να φαίνονται σωστοί, αλλά το ίδιο το μοντέλο να είναι λανθασμένο.

Τι σημαίνει η διωνυμική κατανομή

Υπόθεσε ότι επαναλαμβάνεις το ίδιο είδος δοκιμής nn φορές. Σε κάθε δοκιμή, ονομάζεις τη μία έκβαση επιτυχία και την άλλη αποτυχία.

Αν η πιθανότητα επιτυχίας είναι pp σε κάθε δοκιμή, τότε η τυχαία μεταβλητή XX, δηλαδή ο αριθμός των επιτυχιών, μπορεί να ακολουθεί διωνυμική κατανομή.

Συχνά αυτό γράφεται ως

XBin(n,p)X \sim \text{Bin}(n,p)

Αυτή η σημειογραφία σημαίνει ότι:

  • το nn είναι ο αριθμός των δοκιμών
  • το pp είναι η πιθανότητα επιτυχίας σε κάθε δοκιμή
  • το XX μετρά πόσες επιτυχίες συμβαίνουν

Αυτό είναι ένα μοντέλο καταμέτρησης. Δεν ρωτά ποια δοκιμή ήταν επιτυχής. Ρωτά πόσες επιτυχίες συνέβησαν συνολικά.

Τύπος της διωνυμικής κατανομής

Για ακριβώς kk επιτυχίες, η πιθανότητα είναι

P(X=k)=(nk)pk(1p)nkP(X=k)=\binom{n}{k}p^k(1-p)^{n-k}

Κάθε μέρος έχει τον ρόλο του:

  • το (nk)\binom{n}{k} μετρά με πόσους τρόπους μπορούν να τοποθετηθούν οι kk επιτυχίες ανάμεσα στις nn δοκιμές
  • το pkp^k δίνει την πιθανότητα αυτών των kk επιτυχιών
  • το (1p)nk(1-p)^{n-k} δίνει την πιθανότητα των υπόλοιπων αποτυχιών

Ο τύπος ισχύει για k=0,1,2,,nk=0,1,2,\dots,n.

Πότε μπορείς να χρησιμοποιήσεις τον διωνυμικό τύπο

Χρησιμοποίησε διωνυμικό μοντέλο μόνο όταν ισχύουν όλες οι παρακάτω προϋποθέσεις:

Σταθερός αριθμός δοκιμών

Γνωρίζεις εκ των προτέρων πόσες δοκιμές υπάρχουν. Για παράδειγμα, το να ρίξεις ένα νόμισμα 88 φορές ικανοποιεί αυτή την προϋπόθεση.

Δύο εκβάσεις ανά δοκιμή

Για το γεγονός που παρακολουθείς, κάθε δοκιμή πρέπει να ταξινομείται ως επιτυχία ή αποτυχία. Μια ρίψη ζαριού μπορεί επίσης να ταιριάζει, αν ορίσεις ως επιτυχία κάτι όπως «να φέρεις 66».

Ανεξάρτητες δοκιμές

Μία δοκιμή δεν πρέπει να αλλάζει την πιθανότητα στην επόμενη. Η δειγματοληψία με επανάθεση μπορεί να ικανοποιεί αυτή την προϋπόθεση. Η δειγματοληψία χωρίς επανάθεση από ένα μικρό σύνολο συνήθως όχι.

Σταθερή πιθανότητα επιτυχίας

Η τιμή του pp πρέπει να παραμένει ίδια από δοκιμή σε δοκιμή. Αν η πιθανότητα αλλάζει κάθε φορά, ένα απλό διωνυμικό μοντέλο δεν είναι κατάλληλο.

Λυμένο παράδειγμα: ακριβώς 3 κορόνες σε 5 ρίψεις

Υπόθεσε ότι ένα πειραγμένο νόμισμα φέρνει κορόνα με πιθανότητα 0.60.6. Το ρίχνεις 55 φορές. Ποια είναι η πιθανότητα να φέρεις ακριβώς 33 κορόνες;

Θέτουμε ως επιτυχία την κορόνα. Τότε

n=5,p=0.6,k=3n=5,\quad p=0.6,\quad k=3

Χρησιμοποιούμε τον τύπο:

P(X=3)=(53)(0.6)3(0.4)2P(X=3)=\binom{5}{3}(0.6)^3(0.4)^2

Τώρα υπολόγισε κάθε μέρος:

(53)=10,(0.6)3=0.216,(0.4)2=0.16\binom{5}{3}=10,\quad (0.6)^3=0.216,\quad (0.4)^2=0.16

Άρα

P(X=3)=10(0.216)(0.16)=0.3456P(X=3)=10(0.216)(0.16)=0.3456

Η πιθανότητα να φέρεις ακριβώς 33 κορόνες είναι 0.34560.3456, ή 34.56%34.56\%.

Γιατί είναι έγκυρο εδώ το διωνυμικό μοντέλο; Το πείραμα έχει σταθερό nn, δύο εκβάσεις σε κάθε ρίψη, ανεξάρτητες δοκιμές και την ίδια πιθανότητα p=0.6p=0.6 σε κάθε ρίψη.

Ένα γρήγορο κόλπο για το «τουλάχιστον μία»

Για ερωτήσεις όπως «τουλάχιστον μία επιτυχία», το συμπληρωματικό ενδεχόμενο είναι συχνά πιο γρήγορο από το να προσθέτεις πολλούς όρους.

Για παράδειγμα, αν XBin(5,0.6)X \sim \text{Bin}(5,0.6), τότε

P(X1)=1P(X=0)=1(0.4)5P(X \ge 1)=1-P(X=0)=1-(0.4)^5

Αυτό ισχύει επειδή το «τουλάχιστον μία επιτυχία» είναι το συμπληρωματικό ενδεχόμενο του «καμία επιτυχία».

Συνηθισμένα λάθη σε προβλήματα διωνυμικής κατανομής

Αγνόηση των προϋποθέσεων

Ένα συνηθισμένο λάθος είναι να χρησιμοποιείς τον διωνυμικό τύπο όταν οι δοκιμές δεν είναι ανεξάρτητες. Κλασικό παράδειγμα είναι η επιλογή αντικειμένων χωρίς επανάθεση από ένα μικρό σύνολο, ενώ εξακολουθείς να θεωρείς ότι το pp δεν αλλάζει ποτέ.

Παρερμηνεία του τι σημαίνει «επιτυχία»

Σε ένα διωνυμικό πρόβλημα, η επιτυχία δεν χρειάζεται να σημαίνει κάτι καλό. Σημαίνει μόνο την έκβαση που επέλεξες να μετρήσεις.

Σύγχυση ανάμεσα στα «ακριβώς», «τουλάχιστον» και «το πολύ»

Αυτές οι φράσεις οδηγούν σε διαφορετικούς υπολογισμούς ακόμη και στο ίδιο πείραμα. Το «ακριβώς 33» σημαίνει έναν όρο, το «τουλάχιστον 33» σημαίνει πολλούς όρους και το «το πολύ 33» σημαίνει διαφορετικό άθροισμα.

Πού χρησιμοποιείται η διωνυμική κατανομή

Η διωνυμική κατανομή εμφανίζεται όταν μετράς επαναλαμβανόμενα αποτελέσματα τύπου ναι-ή-όχι, όπως ελαττωματικό ή όχι ελαττωματικό, επιτυχία ή αποτυχία, κλικ ή χωρίς κλικ, ή κορόνα ή γράμματα.

Είναι χρήσιμη στον ποιοτικό έλεγχο, στη δειγματοληψία ερευνών υπό τις σωστές παραδοχές, σε ερωτήματα αξιοπιστίας και σε βασικά πιθανοτικά μοντέλα στη στατιστική.

Δοκίμασε ένα παρόμοιο πρόβλημα

Δοκίμασε τη δική σου εκδοχή με 88 ρίψεις νομίσματος όπου p=0.4p=0.4. Βρες πρώτα το P(X=2)P(X=2) και μετά το P(X1)P(X \ge 1) χρησιμοποιώντας το συμπληρωματικό ενδεχόμενο. Αν θέλεις άλλη μία περίπτωση, σύγκρινε τι αλλάζει όταν οι δοκιμές δεν είναι πλέον ανεξάρτητες.

Χρειάζεσαι βοήθεια με μια άσκηση;

Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.

Άνοιξε το GPAI Solver →