Zスコアは、ある値が平均から標準偏差何個分だけ離れているかを表します。生の数値をそのまま見るだけでなく、集団の中でその値がどの位置にあるかを比べたいときに便利です。
基本の式は次のとおりです。
ここで、 は値、 は平均、 は標準偏差です。
が正なら、その値は平均より上にあります。 が負なら、その値は平均より下にあります。 なら、その値はちょうど平均にあります。
Zスコアの求め方
次の手順で計算します。
- 値 を確認します。
- そこから平均を引きます。
- 標準偏差で割ります。
つまりこの計算は、平均からの生の距離を、標準化された距離に変換しているだけです。
この式の直感的な意味
分子の は、その値が中心からどれだけ離れているかを表します。分母の は、その距離をデータの典型的なばらつきの大きさで調整しています。
そのため、Zスコアは単に「この点数は平均より14点高い」と言っているわけではありません。その14点が、そのデータセットにとって小さい差なのか大きい差なのかまで示してくれます。
計算例
テストの点数が 、クラスの平均が 、標準偏差が だとします。
これらの数値を式に代入すると、
まず引き算をして、
次に割り算をすると、
Zスコアは です。つまり、この点数は平均より標準偏差 個分だけ上にあるということです。
答えの読み方のコツ
- は、平均より標準偏差1個分だけ上にあることを意味します。
- は、平均より標準偏差1.5個分だけ下にあることを意味します。
- のように絶対値が大きいほど、その値は平均から比較的遠いことを意味します。
この解釈は、使った平均と標準偏差に対してのみ成り立ちます。それらが変われば、Zスコアも変わります。
よくある間違い
よくある間違いの1つは、標準偏差ではなく分散で割ってしまうことです。Zスコアで使うのは分散ではなく標準偏差です。
もう1つの間違いは、符号を無視することです。 のZスコアは と同じではありません。前者は平均より下、後者は平均より上を表します。
また、異なる集団のデータを混ぜてしまうこともよくあります。平均や標準偏差が変われば、同じ点数でも、あるクラスでは1つのZスコア、別のクラスでは別のZスコアになることがあります。
Zスコアが使われる場面
Zスコアは、異なる尺度の値を比較したいとき、特に高い値や低い値を見つけたいとき、または生データを正規分布モデルと結びつけたいときに役立ちます。
ただし最後の使い方には条件があります。Zスコアを確率に変換することが特に意味をもつのは、正規モデルが適切な場合、または問題で明示的にそれを使うよう指示されている場合です。
母集団の値と標本の値
多くの統計の式では、Zスコアは母集団の記号を使って次のように書かれます。
もし標本平均 と標本標準偏差 しかない場合は、しばしば次の形で標準化します。
計算の手順自体は同じですが、その値が母集団全体を表しているのか、標本だけを表しているのかによって解釈は変わります。
自分でもやってみよう
好きな値、平均、標準偏差を1組選んで、Zスコアを計算し、その結果を言葉で説明してみましょう。次の練習としては、Zスコアが負になる似た問題も解いてみて、解釈が符号ときちんと一致しているか確かめるのがおすすめです。