O teorema de Bayes mostra como atualizar uma probabilidade depois de observar uma nova evidência. Se P(B)>0P(B) > 0, então

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Ele responde a uma pergunta bem específica: depois que o evento BB aconteceu, qual é agora a probabilidade de o evento AA ocorrer? Essa ideia é importante em testes médicos, filtros de spam e em qualquer situação em que a evidência pode enganar, a menos que você também considere quão comum o evento era desde o início.

Fórmula do teorema de Bayes em linguagem simples

O teorema de Bayes combina três elementos:

  • comece com o que você acreditava antes da evidência, P(A)P(A)
  • pergunte quão compatível a evidência é com esse evento, P(BA)P(B \mid A)
  • ajuste pelo quão comum a evidência é no total, P(B)P(B)

O resultado, P(AB)P(A \mid B), é chamado de probabilidade posterior.

O que significa cada parte da fórmula

Em

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

P(A)P(A) é a probabilidade a priori. É a sua probabilidade inicial para AA antes de usar a nova evidência.

P(BA)P(B \mid A) é a verossimilhança. Ela indica quão provável é a evidência BB se AA for verdadeiro.

P(B)P(B) é a probabilidade da evidência no total. Esse termo importa porque algumas evidências são comuns mesmo quando AA é falso.

P(AB)P(A \mid B) é a probabilidade posterior. É a probabilidade atualizada de AA depois de saber que BB aconteceu.

Por que o denominador muda a resposta

O teorema de Bayes não apenas favorece evidências que combinam com sua hipótese. Ele também pergunta se essa mesma evidência já acontece com frequência de qualquer forma.

É por isso que o denominador P(B)P(B) importa. Se a evidência é comum em muitos casos, observá-la não deve mudar muito sua crença. Se a evidência é rara, exceto quando AA é verdadeiro, ela pode mudar bastante sua crença.

Demonstração curta a partir da probabilidade condicional

Suponha P(B)>0P(B) > 0 e P(A)>0P(A) > 0 quando necessário. Pela definição de probabilidade condicional,

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(A \cap B)}{P(B)}

e

P(BA)=P(AB)P(A)P(B \mid A) = \frac{P(A \cap B)}{P(A)}

Da segunda equação,

P(AB)=P(BA)P(A)P(A \cap B) = P(B \mid A)P(A)

Substituindo isso na primeira equação:

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Esse é o teorema de Bayes.

Exemplo resolvido do teorema de Bayes: um teste médico positivo

Suponha que uma doença afete 1%1\% de uma população. Um teste tem sensibilidade de 99%99\% e taxa de falso positivo de 5%5\%.

Seja

  • DD = a pessoa tem a doença
  • ++ = o teste deu positivo

Então

P(D)=0.01P(D) = 0.01 P(+D)=0.99P(+ \mid D) = 0.99 P(+Dc)=0.05P(+ \mid D^c) = 0.05

Queremos P(D+)P(D \mid +), a probabilidade de uma pessoa realmente ter a doença dado que o teste foi positivo.

Primeiro, encontre a probabilidade total de um resultado positivo. Um teste positivo pode acontecer de duas formas: a pessoa tem a doença e testa positivo, ou a pessoa não tem a doença e ainda assim testa positivo.

P(+)=P(+D)P(D)+P(+Dc)P(Dc)P(+) = P(+ \mid D)P(D) + P(+ \mid D^c)P(D^c) P(+)=(0.99)(0.01)+(0.05)(0.99)=0.0594P(+) = (0.99)(0.01) + (0.05)(0.99) = 0.0594

Agora aplique o teorema de Bayes:

P(D+)=P(+D)P(D)P(+)=(0.99)(0.01)0.0594P(D \mid +) = \frac{P(+ \mid D)P(D)}{P(+)} = \frac{(0.99)(0.01)}{0.0594} P(D+)=0.00990.0594=160.167P(D \mid +) = \frac{0.0099}{0.0594} = \frac{1}{6} \approx 0.167

Assim, a chance de realmente ter a doença após um teste positivo é de cerca de 16.7%16.7\%, e não de 99%99\%. O teste é forte, mas a doença é rara, então a maioria dos resultados positivos ainda vem do grupo muito maior de pessoas sem a doença.

Essa é a principal lição que muita gente deixa passar: mesmo um teste forte pode produzir uma probabilidade posterior modesta quando a condição é rara desde o começo.

Uma versão útil do teorema de Bayes para dois casos

Se a evidência pode vir de dois casos complementares, AA e AcA^c, então

P(B)=P(BA)P(A)+P(BAc)P(Ac)P(B) = P(B \mid A)P(A) + P(B \mid A^c)P(A^c)

Usando isso no teorema de Bayes, obtemos

P(AB)=P(BA)P(A)P(BA)P(A)+P(BAc)P(Ac)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B \mid A)P(A) + P(B \mid A^c)P(A^c)}

Essa forma costuma ser a mais prática em problemas com dois casos.

Erros comuns no teorema de Bayes

Confundir P(AB)P(A \mid B) com P(BA)P(B \mid A)

Essas probabilidades geralmente não são iguais. Um teste positivo pode ser muito provável quando a doença está presente, enquanto a doença ainda pode ser relativamente improvável depois de um teste positivo.

Ignorar a taxa base

A probabilidade a priori P(A)P(A) importa. Se AA é muito raro, então mesmo uma evidência forte pode não elevar a probabilidade posterior tanto quanto a intuição espera.

Calcular P(B)P(B) de forma estreita demais

O denominador não é apenas um termo que sobra. Ele é a probabilidade total da evidência e muitas vezes exige somar contribuições de vários casos.

Usar a fórmula quando P(B)=0P(B) = 0

O teorema de Bayes nessa forma exige P(B)>0P(B) > 0. Se a evidência tem probabilidade 00, a probabilidade condicional P(AB)P(A \mid B) não é definida pela fórmula básica.

Quando o teorema de Bayes é usado

O teorema de Bayes aparece em testes médicos, filtros de spam, análise de confiabilidade, aprendizado de máquina e inferência científica. Em cada caso, a mesma ideia aparece: atualizar uma crença quando chega uma nova informação.

Ele é especialmente útil quando as pessoas tendem a reagir demais à evidência sem perguntar quão comum o evento era em primeiro lugar.

Tente um problema parecido com o teorema de Bayes

Mantenha o mesmo teste médico, mas mude a taxa da doença de 1%1\% para 10%10\%. A sensibilidade e a taxa de falso positivo permanecem as mesmas, mas a probabilidade posterior muda bastante. Resolver essa versão uma vez é uma forma rápida de perceber por que a probabilidade a priori importa.

Precisa de ajuda com um problema?

Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.

Abrir GPAI Solver →