置信区间——公式、计算与示例

置信区间是根据样本数据得到的、对总体参数可能取值的一个合理范围。在很多统计学入门题中，它写成

\text{estimate} \pm \text{margin of error}

误差范围取决于样本中有多大的不确定性，以及你希望达到多高的置信水平。置信水平越高，区间越宽。数据越精确，区间越窄。

用通俗的话理解置信区间

如果你看到一个 $95\%$ 置信区间，最稳妥的理解方式是把重点放在“构造区间的方法”上，而不是某一个已经算出的区间。也就是说，如果用同样的抽样过程重复很多次，并且每次都按同样的方法重新构造区间，那么大约 $95\%$ 的这些区间会包含真实参数。

所以，置信区间是一种展示估计不确定性的方式。它给出的是一个合理范围，而不是保证。

一般结构是

\text{estimate} \pm \text{critical value} \times \text{standard error}

对于总体均值，常见的两种形式是：

\bar{x} \pm z^* \frac{\sigma}{\sqrt{n}}

当总体标准差 $\sigma$ 已知，或者在可以使用 $z$ 临界值进行正态近似时，使用这个形式。

\bar{x} \pm t^* \frac{s}{\sqrt{n}}

当 $\sigma$ 未知，并且你用样本标准差 $s$ 来估计离散程度时，使用这个形式。对于较小样本，通常还要配合“总体近似服从正态分布”这一条件。

很多情形下都遵循同样的结构，但对于均值、比例和其他参数，标准误的具体形式会不同。

最重要的有三个因素：

这就是主要的权衡关系：更高的置信度通常要以更低的精确度为代价。

假设一个样本有 $64$ 个观测值，样本均值为 $\bar{x} = 50$ ，并且已知总体标准差为 $\sigma = 8$ 。用 $z$ 区间为总体均值构造一个 $95\%$ 置信区间。

先写出公式：

\bar{x} \pm z^* \frac{\sigma}{\sqrt{n}}

对于 $95\%$ 的置信水平，取 $z^* \approx 1.96$ 。

现在计算标准误：

\frac{\sigma}{\sqrt{n}} = \frac{8}{\sqrt{64}} = \frac{8}{8} = 1

所以误差范围是

1.96 \times 1 = 1.96

构造区间：

50 \pm 1.96

得到

(48.04,\ 51.96)

实际解释可以是：如果模型条件合理，并且数据确实来自这样的抽样过程，那么 $48.04$ 到 $51.96$ 之间的值都可以看作总体均值的合理取值。

一个常见错误是说：真实参数有 $95\%$ 的概率落在这个具体区间里。在标准的频率学派统计中，参数是固定的，具有长期成功率的是“构造区间的方法”。

另一个错误是不检查条件就直接套用错误的公式。 $z$ 区间、 $t$ 区间和总体比例区间使用的标准误并不相同。

学生还常常把“参数的置信区间”和“原始数据本身的离散范围”混淆。置信区间描述的是估计值的不确定性，而不是大多数单个观测值会落在哪里。

置信区间常见于民意调查、实验、质量控制、医学、经济学以及日常数据报告中。只要你想根据样本对更大的总体作出判断，它就很有用。

在实际应用中，区间往往在与某个目标值或另一个估计值比较时最有意义。较窄的区间比很宽的区间更能支持精确的结论。

你可以自己试一题：取 $\bar{x} = 72$ 、 $\sigma = 10$ 、 $n = 100$ ，构造一个 $95\%$ 置信区间。然后只改变样本量，观察误差范围会发生什么变化。这是建立直觉的最快方法之一，能帮助你理解为什么更大的样本通常会得到更紧的区间。

用简单的话说，什么是置信区间？: 置信区间是根据样本数据得到的、对总体参数可能取值范围的估计。它把点估计和误差范围结合在一起。
95% 置信区间是否表示真实值有 95% 的概率落在这个区间内？: 按通常的频率学派解释，并不是这样。它的意思是：如果用同样的抽样过程重复很多次，并且每次都用同样的方法构造区间，那么大约 95% 的这些区间会包含真实参数。
置信区间的基本公式是什么？: 一般结构是估计值 $\pm$ 临界值 $\times$ 标准误。具体使用哪个临界值和标准误，取决于所估计的参数以及所满足的条件。

上传你的问题，几秒钟内获得经过验证的分步解答。