二項分布は、 回の試行でちょうど 回成功する確率を表します。使えるのは、注目する事象について各試行の結果が2通りで、試行同士が独立であり、毎回の成功確率が同じ場合だけです。
これらの条件のどれか1つでも欠けると、計算自体はそれらしく見えても、モデルとしては誤っています。
二項分布の意味
同じ種類の試行を 回くり返すとします。各試行で、一方の結果を 成功、もう一方を 失敗 とします。
毎回の成功確率が なら、成功回数を表す確率変数 は二項分布に従います。
これはよく次のように書かれます。
この記号の意味は次のとおりです。
- は試行回数
- は各試行での成功確率
- は成功回数
これは回数を数えるモデルです。どの試行で成功したかは問いません。全体で何回成功したかを考えます。
二項分布の公式
ちょうど 回成功する確率は
です。
それぞれの部分には役割があります。
- は、 回の試行の中で 回の成功を並べる方法の数を表します
- は、その 回の成功が起こる確率を表します
- は、残りの失敗が起こる確率を表します
この公式は に対して使えます。
二項分布の公式を使える条件
二項モデルを使えるのは、次の条件がすべて成り立つときだけです。
試行回数が固定されている
試行が全部で何回あるかが最初から決まっています。たとえば、コインを 回投げるのはこの条件に当てはまります。
各試行の結果が2通りである
追跡したい事象について、各試行は成功か失敗かに分類できなければなりません。サイコロでも、「 が出る」を成功と決めれば当てはまります。
試行が独立である
ある試行の結果が、次の試行の確率を変えてはいけません。復元抽出ならこの条件に合うことがあります。小さい集団からの非復元抽出は、ふつうは当てはまりません。
成功確率が一定である
の値は試行ごとに変わってはいけません。毎回確率が変わるなら、単純な二項モデルは適切ではありません。
例題:5回投げてちょうど3回表
表が出る確率が の偏ったコインを考えます。これを 回投げるとき、ちょうど 回表が出る確率は何でしょうか。
表を成功とすると、
です。
公式を使うと、
となります。
各部分を計算すると、
です。
したがって、
となります。
ちょうど 回表が出る確率は 、つまり です。
ここで二項モデルが使える理由は、試行回数 が固定されていて、各試行の結果が2通りで、試行が独立であり、毎回の成功確率が同じ だからです。
「少なくとも1回」の素早い求め方
「少なくとも1回成功」のような問題では、多くの項を足すより余事象を使うほうが速いことがよくあります。
たとえば、 なら、
です。
これは、「少なくとも1回成功」が「0回成功」の余事象だからです。
二項分布の問題でよくある間違い
条件を無視する
よくある間違いは、試行が独立でないのに二項分布の公式を使ってしまうことです。典型例は、小さい集団から非復元抽出しているのに、 が変わらないものとして扱う場合です。
「成功」の意味を読み違える
二項分布でいう成功は、必ずしも良い結果を意味しません。単に数えたいほうの結果を指しているだけです。
「ちょうど」「少なくとも」「高々」を混同する
これらの表現は、同じ実験でも計算が異なります。「ちょうど 回」は1項だけですが、「少なくとも 回」は複数の項の和になり、「高々 回」はまた別の和になります。
二項分布が使われる場面
二項分布は、不良か不良でないか、合格か不合格か、クリックするかしないか、表か裏かのように、はい・いいえ型の結果をくり返し数える場面で現れます。
品質管理、適切な仮定のもとの標本調査、信頼性の問題、統計における基本的な確率モデルなどで役立ちます。
似た問題に挑戦してみよう
今度は、コインを 回投げて の場合を自分で試してみましょう。まず を求め、次に余事象を使って を求めてください。さらに、試行が独立でなくなったときに何が変わるかも比べてみましょう。