方差——公式、计算与示例

方差用来衡量一组数字围绕其平均值的离散程度。方差小，表示各个数值通常比较接近平均值。方差大，表示它们分布得更分散。

计算方差时，先求每个数值与平均值的差，再把这些差平方，最后求平均。平方这一步很重要，因为如果不平方，正偏差和负偏差会相互抵消。

方差公式：总体 vs. 样本

当你的数据包含了你想描述的整个群体中的所有数值时，使用总体方差公式：

\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

当你的数据只是一个样本，而你想估计更大总体的离散程度时，使用样本方差公式：

s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

两者唯一的区别在于分母。完整总体用 $N$ 。样本估计用 $n-1$ 。

方差并不告诉你数据中心在哪里。它告诉你数据通常离这个中心有多远。

如果两组数据的平均值相同，那么方差较大的那一组，其数值平均来说离平均值更远。由于偏差被平方，特别大的差距会产生更大的影响。

还有一个重要细节：方差的单位是原单位的平方。如果数据单位是米，那么方差单位就是平方米。这也是为什么在日常使用中，标准差通常更容易解释。

使用数据集 $2, 4, 4, 4, 5, 5, 7, 9$ 。

先求平均值：

\bar{x} = \frac{2+4+4+4+5+5+7+9}{8} = \frac{40}{8} = 5

现在用每个数值减去平均值，再将结果平方：

$(2-5)^2 = 9$
$(4-5)^2 = 1$
$(4-5)^2 = 1$
$(4-5)^2 = 1$
$(5-5)^2 = 0$
$(5-5)^2 = 0$
$(7-5)^2 = 4$
$(9-5)^2 = 16$

把这些平方后的偏差相加：

9+1+1+1+0+0+4+16 = 32

如果这 8 个数值就是完整总体，那么总体方差为：

\sigma^2 = \frac{32}{8} = 4

如果把这 8 个数值看作来自更大总体的样本，那么样本方差为：

s^2 = \frac{32}{7} \approx 4.57

这个例子清楚地说明了核心思想：平方偏差是一样的，但最终结果会因为你除以 $N$ 还是除以 $n-1$ 而不同。

只要你需要以一致的方式描述或比较离散程度，就会用到方差。

你可以自己试试，用两组平均值相同但离散程度不同的小数据集。分别计算它们的方差，看看分布更宽的那组是否得到更大的数值。只做这一次比较，通常就能真正理解这个概念。

上传你的问题，几秒钟内获得经过验证的分步解答。