标准差衡量的是数据值与均值之间的典型距离。标准差较小,表示数据值都比较接近中心。标准差较大,则表示数据更分散。由于结果保留原始单位,所以它通常比方差更容易解释。
使用小组件比较离散程度
先移动离散程度滑块,再平移中心,最后添加一个离群值。观察哪些变化会影响标准差,哪些变化只是让整个数据集一起移动。
标准差告诉你什么
当所有数据值都相同时,标准差才会等于 。除此之外,并不存在一个通用的“小”或“大”的标准。这个数值只有结合数据集本身的尺度才有意义。
例如,在一场满分 分的考试中,标准差为 分可能很小;但在短跑比赛中,标准差为 秒可能就很大。具体情境很重要。
总体标准差与样本标准差
只有当你的数据包含了你想描述的整个总体时,才使用总体公式。如果你的数据只是一个样本,用来估计更大的总体,就应该使用样本公式。
对于完整总体:
对于样本:
其中的 调整只出现在样本情形中。它用于修正样本均值 也是由同一组数据估计出来这一事实。
例题:均值相同,离散程度不同
比较下面两组数据:
- A 组:
- B 组:
两组数据的均值都是 。但 B 组更分散,所以它的标准差一定更大。
对于 A 组,相对于均值的离差是 。平方后得到 ,总和为 。如果把这组数据看作总体,那么方差是 ,所以标准差为
对于 B 组,离差是 。平方后得到 ,总和为 。总体方差是 ,所以标准差为
两组数据的均值相同,但离散程度不同。这正是标准差要刻画的内容。
在探索器中要注意什么
- 如果把每个数据值都同时移动相同的量,均值会改变,但标准差不会改变。
- 把数据值拉得离均值更远,会增大标准差。
- 单个离群值可能会显著改变结果,因为较大的离差会被平方。
自己动手试一试
在探索器中自己试试,输入两组均值相同的数据。保持中心不变,增大离散程度,再看看标准差是否会按你的预期发生变化。