El teorema de Bayes te dice cómo actualizar una probabilidad después de observar nueva evidencia. Si P(B)>0P(B) > 0, entonces

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Responde una pregunta muy concreta: después de que haya ocurrido el evento BB, ¿qué tan probable es ahora el evento AA? La idea es importante en pruebas médicas, filtrado de spam y cualquier situación en la que la evidencia pueda ser engañosa si no tienes en cuenta también qué tan común era el evento desde el principio.

Fórmula del teorema de Bayes en lenguaje sencillo

El teorema de Bayes combina tres elementos:

  • empieza con lo que creías antes de ver la evidencia, P(A)P(A)
  • pregunta qué tan compatible es la evidencia con ese evento, P(BA)P(B \mid A)
  • ajusta según qué tan común es la evidencia en general, P(B)P(B)

El resultado, P(AB)P(A \mid B), se llama probabilidad posterior.

Qué significa cada parte de la fórmula

En

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

P(A)P(A) es la probabilidad previa. Es tu probabilidad inicial de AA antes de usar la nueva evidencia.

P(BA)P(B \mid A) es la verosimilitud. Te dice qué tan probable es la evidencia BB si AA es verdadero.

P(B)P(B) es la probabilidad de la evidencia en general. Este término importa porque alguna evidencia es común incluso cuando AA es falso.

P(AB)P(A \mid B) es la probabilidad posterior. Es la probabilidad actualizada de AA después de saber que ocurrió BB.

Por qué el denominador cambia la respuesta

El teorema de Bayes no solo favorece la evidencia que encaja con tu hipótesis. También pregunta si esa misma evidencia ocurre con frecuencia de todos modos.

Por eso importa el denominador P(B)P(B). Si la evidencia es común en muchos casos, verla no debería cambiar demasiado tu creencia. Si la evidencia es rara salvo cuando AA es verdadero, puede cambiar mucho tu creencia.

Demostración breve a partir de la probabilidad condicional

Supón que P(B)>0P(B) > 0 y P(A)>0P(A) > 0 cuando haga falta. Por la definición de probabilidad condicional,

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(A \cap B)}{P(B)}

y

P(BA)=P(AB)P(A)P(B \mid A) = \frac{P(A \cap B)}{P(A)}

De la segunda ecuación,

P(AB)=P(BA)P(A)P(A \cap B) = P(B \mid A)P(A)

Sustituye eso en la primera ecuación:

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Ese es el teorema de Bayes.

Ejemplo resuelto del teorema de Bayes: una prueba médica positiva

Supón que una enfermedad afecta al 1%1\% de una población. Una prueba tiene una sensibilidad del 99%99\% y una tasa de falsos positivos del 5%5\%.

Sea

  • DD = la persona tiene la enfermedad
  • ++ = la prueba es positiva

Entonces

P(D)=0.01P(D) = 0.01 P(+D)=0.99P(+ \mid D) = 0.99 P(+Dc)=0.05P(+ \mid D^c) = 0.05

Queremos P(D+)P(D \mid +), la probabilidad de que una persona realmente tenga la enfermedad dado que la prueba salió positiva.

Primero encuentra la probabilidad total de un resultado positivo. Una prueba positiva puede ocurrir de dos maneras: la persona tiene la enfermedad y da positivo, o la persona no tiene la enfermedad y aun así da positivo.

P(+)=P(+D)P(D)+P(+Dc)P(Dc)P(+) = P(+ \mid D)P(D) + P(+ \mid D^c)P(D^c) P(+)=(0.99)(0.01)+(0.05)(0.99)=0.0594P(+) = (0.99)(0.01) + (0.05)(0.99) = 0.0594

Ahora aplica el teorema de Bayes:

P(D+)=P(+D)P(D)P(+)=(0.99)(0.01)0.0594P(D \mid +) = \frac{P(+ \mid D)P(D)}{P(+)} = \frac{(0.99)(0.01)}{0.0594} P(D+)=0.00990.0594=160.167P(D \mid +) = \frac{0.0099}{0.0594} = \frac{1}{6} \approx 0.167

Así que la probabilidad de tener realmente la enfermedad después de una prueba positiva es de aproximadamente 16.7%16.7\%, no del 99%99\%. La prueba es buena, pero la enfermedad es rara, así que la mayoría de los resultados positivos siguen viniendo del grupo mucho más grande de personas sin la enfermedad.

Esta es la lección principal que mucha gente pasa por alto: incluso una prueba buena puede producir una probabilidad posterior moderada cuando la condición es rara desde el principio.

Una versión útil del teorema de Bayes para dos casos

Si la evidencia puede venir de dos casos complementarios, AA y AcA^c, entonces

P(B)=P(BA)P(A)+P(BAc)P(Ac)P(B) = P(B \mid A)P(A) + P(B \mid A^c)P(A^c)

Usar eso en el teorema de Bayes da

P(AB)=P(BA)P(A)P(BA)P(A)+P(BAc)P(Ac)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B \mid A)P(A) + P(B \mid A^c)P(A^c)}

Esta forma suele ser la más práctica en problemas de dos casos.

Errores comunes con el teorema de Bayes

Confundir P(AB)P(A \mid B) con P(BA)P(B \mid A)

Estas probabilidades normalmente no son iguales. Una prueba positiva puede ser muy probable cuando una enfermedad está presente, mientras que la enfermedad puede seguir siendo bastante improbable después de una prueba positiva.

Ignorar la tasa base

La probabilidad previa P(A)P(A) importa. Si AA es muy raro, incluso una evidencia fuerte puede no hacer que la probabilidad posterior suba tanto como la intuición espera.

Calcular P(B)P(B) de forma demasiado limitada

El denominador no es solo un término sobrante. Es la probabilidad total de la evidencia y a menudo requiere sumar contribuciones de varios casos.

Usar la fórmula cuando P(B)=0P(B) = 0

El teorema de Bayes en esta forma requiere P(B)>0P(B) > 0. Si la evidencia tiene probabilidad 00, la probabilidad condicional P(AB)P(A \mid B) no está definida por la fórmula básica.

Cuándo se usa el teorema de Bayes

El teorema de Bayes aparece en pruebas médicas, filtrado de spam, análisis de fiabilidad, aprendizaje automático e inferencia científica. En cada caso aparece la misma idea: actualizar una creencia cuando llega nueva información.

Es especialmente útil cuando las personas tienden a reaccionar en exceso ante la evidencia sin preguntarse qué tan común era el evento en primer lugar.

Prueba un problema similar del teorema de Bayes

Mantén la misma prueba médica, pero cambia la tasa de la enfermedad del 1%1\% al 10%10\%. La sensibilidad y la tasa de falsos positivos siguen siendo las mismas, pero la probabilidad posterior cambia mucho. Resolver esa versión una vez es una forma rápida de notar por qué importa la probabilidad previa.

¿Necesitas ayuda con un problema?

Sube tu pregunta y obtén una solución verificada, paso a paso, en segundos.

Abrir GPAI Solver →