標準偏差は、データの値が平均からどれくらい離れているかを表す代表的な大きさです。標準偏差が小さいほど、値は中心の近くに集まっています。大きいほど、データのばらつきが大きいことを意味します。結果が元の単位のまま表されるため、分散より解釈しやすいことが多いです。

ウィジェットでばらつきを比べてみよう

まず spread のスライダーを動かし、次に中心をずらし、そのあと外れ値を追加してみましょう。どの変化が標準偏差に影響し、どの変化がデータ全体を移動させるだけなのかを観察してください。

Standard deviation explorer

Use the same five-point shape, then test three ideas: widening the spread makes the standard deviation grow, shifting every value together keeps it the same, and an outlier can change it fast.

Formula
Number line

Each dot is one value. The red line marks the mean. Standard deviation grows when the dots sit farther from that line.

-5.44mean 05.44
Current data: -4, -2, 0, 2, 4
SummaryCount: 5Mean: 0Mode: Population standard deviationSum of squared distances: 40Variance: 40 / 5 = 8Standard deviation: 2.828
What to notice

Changing the center shifts the whole group left or right, but it does not change the spread as long as the distances between points stay the same.

An outlier can pull the mean and usually makes the standard deviation larger because one squared distance becomes much bigger than the rest.

Distances from the mean
Valuex - mean(x - mean)^2
-4-416
-2-24
000
224
4416

標準偏差でわかること

標準偏差が 00 になるのは、すべての値が同じときだけです。それ以外では、「小さい」「大きい」を判断する共通の基準はありません。この値は、そのデータセットの尺度と比べてはじめて意味を持ちます。

たとえば、標準偏差が 22 点でも、100100 点満点の試験では小さいかもしれません。一方で、短距離走で標準偏差が 22 秒なら大きいかもしれません。文脈が重要です。

母集団の標準偏差と標本標準偏差

母集団の式を使うのは、記述したい集団全体のデータがそろっているときだけです。より大きな母集団を推定するための標本データなら、代わりに標本の式を使います。

母集団全体の場合は次の式です。

σ=1Ni=1N(xiμ)2\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2}

標本の場合は次の式です。

s=1n1i=1n(xixˉ)2s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2}

この n1n-1 の調整が必要なのは標本の場合だけです。これは、標本平均 xˉ\bar{x} が同じデータから推定されていることを補正するためです。

計算例:平均は同じ、ばらつきは違う

次の 2 つのデータセットを比べてみましょう。

  • Set A: 8,9,10,11,128, 9, 10, 11, 12
  • Set B: 6,8,10,12,146, 8, 10, 12, 14

どちらも平均は 1010 です。しかし、Set B のほうがより広く散らばっているので、標準偏差は大きくなります。

Set A では、平均からの偏差は 2,1,0,1,2-2, -1, 0, 1, 2 です。これを二乗すると 4,1,0,1,44, 1, 0, 1, 4 で、合計は 1010 になります。このデータセットを母集団として扱うと、分散は 10/5=210/5 = 2 なので、標準偏差は

21.41\sqrt{2} \approx 1.41

となります。

Set B では、偏差は 4,2,0,2,4-4, -2, 0, 2, 4 です。これを二乗すると 16,4,0,4,1616, 4, 0, 4, 16 で、合計は 4040 になります。母集団分散は 40/5=840/5 = 8 なので、標準偏差は

82.83\sqrt{8} \approx 2.83

となります。

平均は同じでも、ばらつきは同じではありません。それを表すのが、まさに標準偏差の役割です。

エクスプローラーで注目するポイント

  1. すべての値を同じだけ動かすと平均は変わりますが、標準偏差は変わりません。
  2. 値を平均からより遠ざけると、標準偏差は大きくなります。
  3. 偏差は二乗されるため、1 つの外れ値でも結果を大きく変えることがあります。

自分でも試してみよう

平均が同じ 2 つのデータセットを使って、エクスプローラーで自分でも試してみましょう。中心を固定したまま、ばらつきを広げ、標準偏差が予想どおりに変わるか確かめてください。

問題の解き方でお困りですか?

問題をアップロードすると、検証済みのステップバイステップ解答が数秒で届きます。

GPAI Solver を開く →