Z 分数表示某个数值距离均值有多远,单位是标准差。正因为如此,当你想把一个分数和整组数据进行比较,而不只是单看原始数值时,它就很有用。
基本公式是
其中, 是该数值, 是均值, 是标准差。
如果 为正,说明该数值高于均值。如果 为负,说明该数值低于均值。如果 ,说明该数值正好等于均值。
如何计算 Z 分数
按下面步骤进行:
- 从数值 开始。
- 减去均值。
- 再除以标准差。
整个计算本质上就是:把某个值与均值之间的原始距离,转换成标准化后的距离。
直观理解这个公式
分子 表示这个数值离中心有多远。分母 则用数据通常的离散程度,对这个距离进行重新缩放。
所以,Z 分数不只是说“这个分数比平均分高 14 分”。它还说明,对于这组特定数据来说,14 分到底算是小差距还是大差距。
例题演算
假设某次考试成绩是 ,班级平均分是 ,标准差是 。
把这些数代入公式:
先做减法:
再做除法:
这个 Z 分数是 。这表示该成绩比均值高出 个标准差。
快速读懂结果的方法
- 表示高于均值 个标准差。
- 表示低于均值 个标准差。
- 更大的绝对值,例如 ,表示该数值相对均值较远。
这种解释只对你所使用的均值和标准差成立。如果它们改变了,Z 分数也会随之改变。
常见错误
一个常见错误是用方差去除,而不是用标准差。Z 分数使用的是标准差,不是方差。
另一个错误是忽略符号。 的 Z 分数和 并不一样。前者在均值以下,后者在均值以上。
另外,也很容易把不同组的数据混在一起。如果均值或标准差不同,同一个分数在一个班里可能有一个 Z 分数,在另一个班里则可能有不同的 Z 分数。
人们什么时候会用 Z 分数
当你想比较不同量表上的数值、找出异常偏高或偏低的观测值,或者把原始数据与正态分布模型联系起来时,Z 分数都很有用。
不过最后一种用途有一个前提:只有在正态模型适用,或者题目明确要求你使用正态模型时,把 Z 分数转换为概率才最有意义。
总体数据与样本数据
在很多统计公式中,Z 分数会写成总体符号的形式:
如果你只有样本均值 和样本标准差 ,人们也常常用下面的式子做标准化:
计算步骤是一样的,但如何解释结果,要看这些数值描述的是总体,还是只是一个样本。
自己试一题
任选一个数值、均值和标准差,然后算出它的 Z 分数,并用文字解释结果。如果你想做一个更有帮助的练习,可以再解一道 Z 分数为负的类似题,检查你的解释是否仍然和符号一致。