¿Qué es el teorema de Bayes en términos simples?

El teorema de Bayes te dice cómo actualizar la probabilidad de un evento después de ver nueva evidencia. Combina tu probabilidad inicial, qué tan bien encaja la evidencia con el evento y qué tan común es esa evidencia en general.

¿Por qué el teorema de Bayes suele ser confuso?

Muchos estudiantes confunden $P(A \mid B)$ con $P(B \mid A)$, o ignoran la tasa base. El teorema de Bayes te obliga a tener en cuenta ambas cosas.

Teorema de Bayes — Fórmula, demostración y ejemplos

El teorema de Bayes te dice cómo actualizar una probabilidad después de observar nueva evidencia. Si $P(B) > 0$ , entonces

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Responde una pregunta muy concreta: después de que haya ocurrido el evento $B$ , ¿qué tan probable es ahora el evento $A$ ? La idea es importante en pruebas médicas, filtrado de spam y cualquier situación en la que la evidencia pueda ser engañosa si no tienes en cuenta también qué tan común era el evento desde el principio.

Fórmula del teorema de Bayes en lenguaje sencillo

El teorema de Bayes combina tres elementos:

empieza con lo que creías antes de ver la evidencia, $P(A)$
pregunta qué tan compatible es la evidencia con ese evento, $P(B \mid A)$
ajusta según qué tan común es la evidencia en general, $P(B)$

El resultado, $P(A \mid B)$ , se llama probabilidad posterior.

Qué significa cada parte de la fórmula

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

$P(A)$ es la probabilidad previa. Es tu probabilidad inicial de $A$ antes de usar la nueva evidencia.

$P(B \mid A)$ es la verosimilitud. Te dice qué tan probable es la evidencia $B$ si $A$ es verdadero.

$P(B)$ es la probabilidad de la evidencia en general. Este término importa porque alguna evidencia es común incluso cuando $A$ es falso.

$P(A \mid B)$ es la probabilidad posterior. Es la probabilidad actualizada de $A$ después de saber que ocurrió $B$ .

Por qué el denominador cambia la respuesta

El teorema de Bayes no solo favorece la evidencia que encaja con tu hipótesis. También pregunta si esa misma evidencia ocurre con frecuencia de todos modos.

Por eso importa el denominador $P(B)$ . Si la evidencia es común en muchos casos, verla no debería cambiar demasiado tu creencia. Si la evidencia es rara salvo cuando $A$ es verdadero, puede cambiar mucho tu creencia.

Demostración breve a partir de la probabilidad condicional

Supón que $P(B) > 0$ y $P(A) > 0$ cuando haga falta. Por la definición de probabilidad condicional,

P(A \mid B) = \frac{P(A \cap B)}{P(B)}

P(B \mid A) = \frac{P(A \cap B)}{P(A)}

De la segunda ecuación,

P(A \cap B) = P(B \mid A)P(A)

Sustituye eso en la primera ecuación:

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Ese es el teorema de Bayes.

Ejemplo resuelto del teorema de Bayes: una prueba médica positiva

Supón que una enfermedad afecta al $1\%$ de una población. Una prueba tiene una sensibilidad del $99\%$ y una tasa de falsos positivos del $5\%$ .

Sea

$D$ = la persona tiene la enfermedad
$+$ = la prueba es positiva

Entonces

P(D) = 0.01

P(+ \mid D) = 0.99

P(+ \mid D^c) = 0.05

Queremos $P(D \mid +)$ , la probabilidad de que una persona realmente tenga la enfermedad dado que la prueba salió positiva.

Primero encuentra la probabilidad total de un resultado positivo. Una prueba positiva puede ocurrir de dos maneras: la persona tiene la enfermedad y da positivo, o la persona no tiene la enfermedad y aun así da positivo.

P(+) = P(+ \mid D)P(D) + P(+ \mid D^c)P(D^c)

P(+) = (0.99)(0.01) + (0.05)(0.99) = 0.0594

Ahora aplica el teorema de Bayes:

P(D \mid +) = \frac{P(+ \mid D)P(D)}{P(+)} = \frac{(0.99)(0.01)}{0.0594}

P(D \mid +) = \frac{0.0099}{0.0594} = \frac{1}{6} \approx 0.167

Así que la probabilidad de tener realmente la enfermedad después de una prueba positiva es de aproximadamente $16.7\%$ , no del $99\%$ . La prueba es buena, pero la enfermedad es rara, así que la mayoría de los resultados positivos siguen viniendo del grupo mucho más grande de personas sin la enfermedad.

Esta es la lección principal que mucha gente pasa por alto: incluso una prueba buena puede producir una probabilidad posterior moderada cuando la condición es rara desde el principio.

Una versión útil del teorema de Bayes para dos casos

Si la evidencia puede venir de dos casos complementarios, $A$ y $A^c$ , entonces

P(B) = P(B \mid A)P(A) + P(B \mid A^c)P(A^c)

Usar eso en el teorema de Bayes da

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B \mid A)P(A) + P(B \mid A^c)P(A^c)}

Esta forma suele ser la más práctica en problemas de dos casos.

Errores comunes con el teorema de Bayes

Confundir $P(A \mid B)$ con $P(B \mid A)$

Estas probabilidades normalmente no son iguales. Una prueba positiva puede ser muy probable cuando una enfermedad está presente, mientras que la enfermedad puede seguir siendo bastante improbable después de una prueba positiva.

Ignorar la tasa base

La probabilidad previa $P(A)$ importa. Si $A$ es muy raro, incluso una evidencia fuerte puede no hacer que la probabilidad posterior suba tanto como la intuición espera.

Calcular $P(B)$ de forma demasiado limitada

El denominador no es solo un término sobrante. Es la probabilidad total de la evidencia y a menudo requiere sumar contribuciones de varios casos.

Usar la fórmula cuando $P(B) = 0$

El teorema de Bayes en esta forma requiere $P(B) > 0$ . Si la evidencia tiene probabilidad $0$ , la probabilidad condicional $P(A \mid B)$ no está definida por la fórmula básica.

Cuándo se usa el teorema de Bayes

El teorema de Bayes aparece en pruebas médicas, filtrado de spam, análisis de fiabilidad, aprendizaje automático e inferencia científica. En cada caso aparece la misma idea: actualizar una creencia cuando llega nueva información.

Es especialmente útil cuando las personas tienden a reaccionar en exceso ante la evidencia sin preguntarse qué tan común era el evento en primer lugar.

Prueba un problema similar del teorema de Bayes

Mantén la misma prueba médica, pero cambia la tasa de la enfermedad del $1\%$ al $10\%$ . La sensibilidad y la tasa de falsos positivos siguen siendo las mismas, pero la probabilidad posterior cambia mucho. Resolver esa versión una vez es una forma rápida de notar por qué importa la probabilidad previa.

¿Necesitas ayuda con un problema?

Sube tu pregunta y obtén una solución verificada, paso a paso, en segundos.

Abrir GPAI Solver →