O que é o teorema de Bayes em termos simples?

O teorema de Bayes mostra como atualizar a probabilidade de um evento depois de observar uma nova evidência. Ele combina sua probabilidade inicial, o quanto a evidência é compatível com o evento e quão comum essa evidência é no total.

Por que o teorema de Bayes costuma causar confusão?

Muitos estudantes confundem $P(A \mid B)$ com $P(B \mid A)$ ou ignoram a taxa base. O teorema de Bayes obriga você a levar os dois em conta.

Teorema de Bayes — Fórmula, Demonstração e Exemplos

O teorema de Bayes mostra como atualizar uma probabilidade depois de observar uma nova evidência. Se $P(B) > 0$ , então

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Ele responde a uma pergunta bem específica: depois que o evento $B$ aconteceu, qual é agora a probabilidade de o evento $A$ ocorrer? Essa ideia é importante em testes médicos, filtros de spam e em qualquer situação em que a evidência pode enganar, a menos que você também considere quão comum o evento era desde o início.

Fórmula do teorema de Bayes em linguagem simples

O teorema de Bayes combina três elementos:

comece com o que você acreditava antes da evidência, $P(A)$
pergunte quão compatível a evidência é com esse evento, $P(B \mid A)$
ajuste pelo quão comum a evidência é no total, $P(B)$

O resultado, $P(A \mid B)$ , é chamado de probabilidade posterior.

O que significa cada parte da fórmula

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

$P(A)$ é a probabilidade a priori. É a sua probabilidade inicial para $A$ antes de usar a nova evidência.

$P(B \mid A)$ é a verossimilhança. Ela indica quão provável é a evidência $B$ se $A$ for verdadeiro.

$P(B)$ é a probabilidade da evidência no total. Esse termo importa porque algumas evidências são comuns mesmo quando $A$ é falso.

$P(A \mid B)$ é a probabilidade posterior. É a probabilidade atualizada de $A$ depois de saber que $B$ aconteceu.

Por que o denominador muda a resposta

O teorema de Bayes não apenas favorece evidências que combinam com sua hipótese. Ele também pergunta se essa mesma evidência já acontece com frequência de qualquer forma.

É por isso que o denominador $P(B)$ importa. Se a evidência é comum em muitos casos, observá-la não deve mudar muito sua crença. Se a evidência é rara, exceto quando $A$ é verdadeiro, ela pode mudar bastante sua crença.

Demonstração curta a partir da probabilidade condicional

Suponha $P(B) > 0$ e $P(A) > 0$ quando necessário. Pela definição de probabilidade condicional,

P(A \mid B) = \frac{P(A \cap B)}{P(B)}

P(B \mid A) = \frac{P(A \cap B)}{P(A)}

Da segunda equação,

P(A \cap B) = P(B \mid A)P(A)

Substituindo isso na primeira equação:

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Esse é o teorema de Bayes.

Exemplo resolvido do teorema de Bayes: um teste médico positivo

Suponha que uma doença afete $1\%$ de uma população. Um teste tem sensibilidade de $99\%$ e taxa de falso positivo de $5\%$ .

Seja

$D$ = a pessoa tem a doença
$+$ = o teste deu positivo

Então

P(D) = 0.01

P(+ \mid D) = 0.99

P(+ \mid D^c) = 0.05

Queremos $P(D \mid +)$ , a probabilidade de uma pessoa realmente ter a doença dado que o teste foi positivo.

Primeiro, encontre a probabilidade total de um resultado positivo. Um teste positivo pode acontecer de duas formas: a pessoa tem a doença e testa positivo, ou a pessoa não tem a doença e ainda assim testa positivo.

P(+) = P(+ \mid D)P(D) + P(+ \mid D^c)P(D^c)

P(+) = (0.99)(0.01) + (0.05)(0.99) = 0.0594

Agora aplique o teorema de Bayes:

P(D \mid +) = \frac{P(+ \mid D)P(D)}{P(+)} = \frac{(0.99)(0.01)}{0.0594}

P(D \mid +) = \frac{0.0099}{0.0594} = \frac{1}{6} \approx 0.167

Assim, a chance de realmente ter a doença após um teste positivo é de cerca de $16.7\%$ , e não de $99\%$ . O teste é forte, mas a doença é rara, então a maioria dos resultados positivos ainda vem do grupo muito maior de pessoas sem a doença.

Essa é a principal lição que muita gente deixa passar: mesmo um teste forte pode produzir uma probabilidade posterior modesta quando a condição é rara desde o começo.

Uma versão útil do teorema de Bayes para dois casos

Se a evidência pode vir de dois casos complementares, $A$ e $A^c$ , então

P(B) = P(B \mid A)P(A) + P(B \mid A^c)P(A^c)

Usando isso no teorema de Bayes, obtemos

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B \mid A)P(A) + P(B \mid A^c)P(A^c)}

Essa forma costuma ser a mais prática em problemas com dois casos.

Erros comuns no teorema de Bayes

Confundir $P(A \mid B)$ com $P(B \mid A)$

Essas probabilidades geralmente não são iguais. Um teste positivo pode ser muito provável quando a doença está presente, enquanto a doença ainda pode ser relativamente improvável depois de um teste positivo.

Ignorar a taxa base

A probabilidade a priori $P(A)$ importa. Se $A$ é muito raro, então mesmo uma evidência forte pode não elevar a probabilidade posterior tanto quanto a intuição espera.

Calcular $P(B)$ de forma estreita demais

O denominador não é apenas um termo que sobra. Ele é a probabilidade total da evidência e muitas vezes exige somar contribuições de vários casos.

Usar a fórmula quando $P(B) = 0$

O teorema de Bayes nessa forma exige $P(B) > 0$ . Se a evidência tem probabilidade $0$ , a probabilidade condicional $P(A \mid B)$ não é definida pela fórmula básica.

Quando o teorema de Bayes é usado

O teorema de Bayes aparece em testes médicos, filtros de spam, análise de confiabilidade, aprendizado de máquina e inferência científica. Em cada caso, a mesma ideia aparece: atualizar uma crença quando chega uma nova informação.

Ele é especialmente útil quando as pessoas tendem a reagir demais à evidência sem perguntar quão comum o evento era em primeiro lugar.

Tente um problema parecido com o teorema de Bayes

Mantenha o mesmo teste médico, mas mude a taxa da doença de $1\%$ para $10\%$ . A sensibilidade e a taxa de falso positivo permanecem as mesmas, mas a probabilidade posterior muda bastante. Resolver essa versão uma vez é uma forma rápida de perceber por que a probabilidade a priori importa.

Precisa de ajuda com um problema?

Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.

Abrir GPAI Solver →