ベイズの定理は、新しい証拠を見たあとで確率を更新する方法を与えます。P(B)>0 なら、
P(A∣B)=P(B)P(B∣A)P(A)
となります。
この式が答えるのは、とても具体的な問いです。事象 B が起こったあとで、事象 A は今どれくらい起こりそうか、ということです。この考え方は、医療検査、スパム判定、そして最初にその事象がどれくらい一般的かを考えないと証拠に惑わされやすいあらゆる場面で重要です。
ベイズの定理の公式をやさしく言うと
ベイズの定理は、次の3つの要素を組み合わせます。
- 証拠を見る前にもっていた考え P(A)
- その証拠がその事象とどれだけ整合するか P(B∣A)
- その証拠が全体としてどれくらい起こりやすいか P(B)
得られる P(A∣B) を 事後確率 といいます。
公式の各部分の意味
次の式で
P(A∣B)=P(B)P(B∣A)P(A)
P(A) は 事前確率 です。新しい証拠を使う前の、A に対する出発点の確率です。
P(B∣A) は 尤度 です。A が真であるときに、証拠 B がどれくらい起こりやすいかを表します。
P(B) は証拠そのものの全体としての確率です。この項が重要なのは、A が偽でもよく現れる証拠があるからです。
P(A∣B) は 事後確率 です。B が起こったとわかったあとで更新された A の確率です。
なぜ分母で答えが変わるのか
ベイズの定理は、仮説に合う証拠をただ評価するだけではありません。その同じ証拠が、そもそもよく起こるものかどうかも問います。
だからこそ分母の P(B) が重要です。証拠が多くのケースでよく見られるなら、それを見ても考えはあまり変わるべきではありません。逆に、A が真のとき以外はめったに現れない証拠なら、考えは大きく変わりえます。
条件付き確率からの短い証明
必要に応じて P(B)>0 および P(A)>0 を仮定します。条件付き確率の定義より、
P(A∣B)=P(B)P(A∩B)
また、
P(B∣A)=P(A)P(A∩B)
です。
2つ目の式から、
P(A∩B)=P(B∣A)P(A)
となります。
これを1つ目の式に代入すると、
P(A∣B)=P(B)P(B∣A)P(A)
となります。
これがベイズの定理です。
ベイズの定理の計算例:医療検査で陽性が出た場合
ある病気にかかっている人が、ある集団の 1% いるとします。検査の感度は 99%、偽陽性率は 5% です。
次のようにおきます。
- D = その人が病気にかかっている
- + = 検査結果が陽性である
すると、
P(D)=0.01
P(+∣D)=0.99
P(+∣Dc)=0.05
です。
求めたいのは P(D∣+)、つまり陽性と出たときに実際にその人が病気である確率です。
まず、陽性になる全体の確率を求めます。陽性は2通りで起こります。その人が病気で陽性になる場合と、病気ではないのに陽性になる場合です。
P(+)=P(+∣D)P(D)+P(+∣Dc)P(Dc)
P(+)=(0.99)(0.01)+(0.05)(0.99)=0.0594
次に、ベイズの定理を使います。
P(D∣+)=P(+)P(+∣D)P(D)=0.0594(0.99)(0.01)
P(D∣+)=0.05940.0099=61≈0.167
したがって、1回陽性が出たあとで実際に病気である確率は約 16.7% であり、99% ではありません。検査自体は強力ですが、病気がまれなので、陽性の多くは病気でない大きな集団から出てきます。
ここが多くの人が見落とす重要な点です。もともとの病気の頻度が低いと、性能のよい検査でも事後確率はそれほど高くならないことがあります。
ベイズの定理の便利な2ケース版
証拠が、補集合の関係にある2つのケース A と Ac から生じるなら、
P(B)=P(B∣A)P(A)+P(B∣Ac)P(Ac)
です。
これをベイズの定理に使うと、
P(A∣B)=P(B∣A)P(A)+P(B∣Ac)P(Ac)P(B∣A)P(A)
となります。
この形は、2ケースの問題で特に実用的です。
ベイズの定理でよくある間違い
P(A∣B) と P(B∣A) を取り違える
これらの確率は、ふつう同じではありません。病気があるときに陽性が出る確率は高くても、陽性が出たあとで病気である確率はそれほど高くないことがあります。
ベースレートを無視する
事前確率 P(A) は重要です。A が非常にまれなら、強い証拠があっても、直感ほど事後確率は高くならないことがあります。
P(B) を狭く計算しすぎる
分母は単なる余りの項ではありません。証拠の全確率であり、多くの場合、複数のケースからの寄与を足し合わせる必要があります。
P(B)=0 のときに公式を使う
この形のベイズの定理は P(B)>0 を必要とします。証拠の確率が 0 なら、条件付き確率 P(A∣B) は基本公式では定義されません。
ベイズの定理はいつ使われるか
ベイズの定理は、医療検査、スパム判定、信頼性解析、機械学習、科学的推論に現れます。どの場合でも共通する考え方は、新しい情報が入ったときに信念を更新することです。
特に、最初にその事象がどれくらい一般的だったかを考えずに、証拠に過剰反応しがちな場面で役立ちます。
似たベイズの定理の問題に挑戦してみよう
同じ医療検査を使い、病気の割合だけを 1% から 10% に変えてみてください。感度と偽陽性率は同じでも、事後確率は大きく変わります。このバージョンを一度解いてみると、事前確率がなぜ重要かをすばやく実感できます。