二项分布告诉你:在 次试验中,恰好得到 次成功的概率是多少。只有当每次试验对你关心的事件都只有两种结果、各次试验相互独立,并且每次成功概率都相同时,才能使用它。
如果这些条件中有一个不成立,那么即使计算过程看起来没问题,模型本身也可能是错的。
二项分布的含义
假设你把同一种试验重复进行 次。每次试验中,你把一种结果记为成功,另一种结果记为失败。
如果每次试验成功的概率都是 ,那么随机变量 (表示成功的次数)就可能服从二项分布。
你经常会看到它写成
这个记号表示:
- 是试验次数
- 是每次试验成功的概率
- 统计成功出现了多少次
这是一个计数模型。它不关心是哪几次试验成功了,而是关心总共发生了多少次成功。
二项分布公式
恰好出现 次成功时,概率为
其中每一部分都有自己的作用:
- 表示在 次试验中安排这 次成功有多少种方式
- 表示这 次成功发生的概率
- 表示其余失败发生的概率
这个公式适用于 。
什么时候可以使用二项分布公式
只有当下面所有条件都成立时,才能使用二项模型:
试验次数固定
你事先知道一共要进行多少次试验。比如,把一枚硬币抛 次就满足这个条件。
每次试验只有两种结果
对于你正在追踪的事件,每次试验都必须能归类为成功或失败。掷骰子也可以满足这个条件,只要你把成功定义为类似“掷出 点”这样的事件。
各次试验相互独立
一次试验不应改变下一次试验的概率。放回抽样可以满足这个条件;而从一个小总体中不放回抽样通常不满足。
成功概率保持不变
的值必须在每次试验中都相同。如果每次成功的机会都在变化,那么简单的二项模型就不合适。
例题:5 次抛掷中恰好出现 3 次正面
假设一枚有偏硬币出现正面的概率是 。你把它抛 次。恰好得到 次正面的概率是多少?
把正面看作成功事件。那么
使用公式:
现在分别计算各部分:
所以
恰好得到 次正面的概率是 ,也就是 。
为什么这里二项模型是有效的?因为这个实验有固定的 ,每次抛掷只有两种结果,各次试验相互独立,而且每次的概率都相同,即 。
“至少一次”的快速技巧
对于“至少一次成功”这类问题,用补事件通常比把很多项加起来更快。
例如,如果 ,那么
之所以这样做,是因为“至少一次成功”正是“零次成功”的补事件。
二项分布题中的常见错误
忽略条件
一个常见错误是在试验不独立时仍然使用二项公式。经典例子是:从一个小集合中不放回抽取,却仍然假设 从不变化。
误解“成功”的含义
在二项分布问题中,成功不一定表示“好结果”。它只是你选择去统计的那个结果。
混淆“恰好”“至少”和“至多”
这些说法即使在同一个实验中,也对应不同的计算方式。“恰好 次”只对应一项;“至少 次”需要若干项相加;“至多 次”则是另一种求和。
二项分布的应用场景
当你统计重复出现的“是或否”型结果时,二项分布就会出现,比如次品与非次品、通过与未通过、点击与未点击、正面与反面。
它在质量控制、满足适当前提下的抽样调查、可靠性问题以及统计学中的基础概率模型里都很有用。
试着做一道类似的题
你可以自己试试:把一枚硬币抛 次,其中 。先求 ,再用补事件求 。如果你想进一步思考,也可以比较一下当各次试验不再独立时,会发生什么变化。