標準偏差は、データの値が平均からどれくらい離れているかを表す代表的な大きさです。標準偏差が小さいほど、値は中心の近くに集まっています。大きいほど、データのばらつきが大きいことを意味します。結果が元の単位のまま表されるため、分散より解釈しやすいことが多いです。
ウィジェットでばらつきを比べてみよう
まず spread のスライダーを動かし、次に中心をずらし、そのあと外れ値を追加してみましょう。どの変化が標準偏差に影響し、どの変化がデータ全体を移動させるだけなのかを観察してください。
標準偏差でわかること
標準偏差が になるのは、すべての値が同じときだけです。それ以外では、「小さい」「大きい」を判断する共通の基準はありません。この値は、そのデータセットの尺度と比べてはじめて意味を持ちます。
たとえば、標準偏差が 点でも、 点満点の試験では小さいかもしれません。一方で、短距離走で標準偏差が 秒なら大きいかもしれません。文脈が重要です。
母集団の標準偏差と標本標準偏差
母集団の式を使うのは、記述したい集団全体のデータがそろっているときだけです。より大きな母集団を推定するための標本データなら、代わりに標本の式を使います。
母集団全体の場合は次の式です。
標本の場合は次の式です。
この の調整が必要なのは標本の場合だけです。これは、標本平均 が同じデータから推定されていることを補正するためです。
計算例:平均は同じ、ばらつきは違う
次の 2 つのデータセットを比べてみましょう。
- Set A:
- Set B:
どちらも平均は です。しかし、Set B のほうがより広く散らばっているので、標準偏差は大きくなります。
Set A では、平均からの偏差は です。これを二乗すると で、合計は になります。このデータセットを母集団として扱うと、分散は なので、標準偏差は
となります。
Set B では、偏差は です。これを二乗すると で、合計は になります。母集団分散は なので、標準偏差は
となります。
平均は同じでも、ばらつきは同じではありません。それを表すのが、まさに標準偏差の役割です。
エクスプローラーで注目するポイント
- すべての値を同じだけ動かすと平均は変わりますが、標準偏差は変わりません。
- 値を平均からより遠ざけると、標準偏差は大きくなります。
- 偏差は二乗されるため、1 つの外れ値でも結果を大きく変えることがあります。
自分でも試してみよう
平均が同じ 2 つのデータセットを使って、エクスプローラーで自分でも試してみましょう。中心を固定したまま、ばらつきを広げ、標準偏差が予想どおりに変わるか確かめてください。