Le théorème de Bayes explique comment mettre à jour une probabilité après l’observation d’une nouvelle information. Si , alors
Il répond à une question très précise : après que l’événement s’est produit, quelle est maintenant la probabilité de l’événement ? Cette idée est importante dans les tests médicaux, le filtrage des spams et toute situation où une information peut être trompeuse si l’on ne tient pas aussi compte de la fréquence initiale de l’événement.
Formule du théorème de Bayes en langage simple
Le théorème de Bayes combine trois éléments :
- partir de ce que vous pensiez avant l’information,
- se demander à quel point l’information est compatible avec cet événement,
- ajuster par la fréquence globale de l’information,
Le résultat, , s’appelle la probabilité a posteriori.
Ce que signifie chaque partie de la formule
Dans
est le prior. C’est votre probabilité de départ pour avant d’utiliser la nouvelle information.
est la vraisemblance. Elle indique à quel point l’information est probable si est vrai.
est la probabilité globale de l’information. Ce terme est important, car certaines informations sont fréquentes même lorsque est faux.
est le posterior. C’est la probabilité mise à jour de après avoir appris que s’est produit.
Pourquoi le dénominateur change la réponse
Le théorème de Bayes ne se contente pas de récompenser une information qui va dans le sens de votre hypothèse. Il demande aussi si cette même information apparaît souvent de toute façon.
C’est pourquoi le dénominateur est important. Si l’information est fréquente dans de nombreux cas, l’observer ne doit pas beaucoup modifier votre croyance. Si elle est rare sauf lorsque est vrai, elle peut fortement faire évoluer votre estimation.
Démonstration courte à partir de la probabilité conditionnelle
Supposons que et, si nécessaire, que . Par définition de la probabilité conditionnelle,
et
À partir de la deuxième équation,
Remplaçons cela dans la première équation :
C’est le théorème de Bayes.
Exemple résolu du théorème de Bayes : un test médical positif
Supposons qu’une maladie touche d’une population. Un test a une sensibilité de et un taux de faux positifs de .
Posons
- = la personne a la maladie
- = le test est positif
Alors
Nous cherchons , la probabilité qu’une personne ait réellement la maladie sachant que le test est positif.
Commençons par trouver la probabilité globale d’un résultat positif. Un test positif peut se produire de deux façons : la personne a la maladie et le test est positif, ou la personne n’a pas la maladie et le test est quand même positif.
Appliquons maintenant le théorème de Bayes :
Ainsi, la probabilité d’avoir réellement la maladie après un test positif est d’environ , et non de . Le test est performant, mais la maladie est rare, donc la plupart des résultats positifs proviennent encore du groupe beaucoup plus grand des personnes non malades.
C’est la leçon principale que beaucoup de gens manquent : même un test performant peut conduire à une probabilité a posteriori modérée lorsque la maladie est rare au départ.
Une version utile du théorème de Bayes à deux cas
Si l’information peut provenir de deux cas complémentaires, et , alors
En utilisant cela dans le théorème de Bayes, on obtient
Cette forme est souvent la plus pratique dans les problèmes à deux cas.
Erreurs fréquentes avec le théorème de Bayes
Confondre et
Ces probabilités ne sont généralement pas égales. Un test positif peut être très probable quand une maladie est présente, alors que la maladie peut malgré tout rester assez peu probable après un test positif.
Ignorer le taux de base
Le prior compte. Si est très rare, même une information forte peut ne pas faire monter le posterior autant que l’intuition le suggère.
Calculer de façon trop restrictive
Le dénominateur n’est pas juste un terme restant. C’est la probabilité totale de l’information, et il faut souvent additionner les contributions de plusieurs cas.
Utiliser la formule quand
Le théorème de Bayes sous cette forme exige que . Si l’information a une probabilité nulle, la probabilité conditionnelle n’est pas définie par la formule de base.
Quand utilise-t-on le théorème de Bayes ?
Le théorème de Bayes apparaît dans les tests médicaux, le filtrage des spams, l’analyse de fiabilité, le machine learning et l’inférence scientifique. Dans chaque cas, on retrouve la même idée : mettre à jour une croyance quand une nouvelle information arrive.
Il est particulièrement utile lorsque les gens ont tendance à surinterpréter une information sans se demander à quel point l’événement était fréquent au départ.
Essayez un problème similaire sur le théorème de Bayes
Gardez le même test médical, mais faites passer le taux de maladie de à . La sensibilité et le taux de faux positifs restent les mêmes, mais le posterior change beaucoup. Faire ce calcul une fois est un moyen rapide de comprendre pourquoi le prior est important.
Besoin d'aide pour un problème ?
Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.
Ouvrir GPAI Solver →