標準誤差は、標本から得た推定値が、ある無作為標本から別の無作為標本へと変わるときに、通常どれくらい変動するかを表します。このページで扱う推定値は標本平均です。これは生データそのもののばらつきではなく、平均の標本抽出による典型的な変動を測るものです。
標本平均に対する標準誤差は、
母標準偏差 が既知ならこの式で表されます。実際には は未知であることが多いため、標本標準偏差 で近似します。
この式は、通常の前提のもとで平均に対して使うものです。つまり、観測値を独立な無作為標本として扱い、標本平均の精度を知りたいときに使います。標準誤差が小さいほど、推定はより精密です。
標準誤差が実際に測っているもの
標準誤差が関係するのは、個々の観測値ではなく推定値です。同じ母集団から同じ大きさの標本を何度も取り直すと、標本平均は少しずつ動きます。標準誤差は、その動きの典型的な大きさを表します。
そのため、 が大きくなると標準誤差は小さくなります。データの集め方が同程度であるなら、より多くの観測値を平均することで、標本平均は標本ごとにより安定しやすくなります。
標準誤差と標準偏差の違い
ここが最も混同されやすい点です。標準偏差は、1つのデータセットの中でデータ値がどれくらい散らばっているかを表します。標準誤差は、標本平均のような統計量が、標本を何度も取り直したときにどれくらい散らばるかを表します。
平均については、両者は次の式で結びついています。
これは標本から推定しているときの式です。つまり、標準誤差は標準偏差を使って計算しますが、答えている問いは異なります。
次のように覚えると便利です。
- 標準偏差は「データ値はどれくらい散らばっているか」を問います。
- 標準誤差は「標本平均は推定値としてどれくらい精密か」を問います。
標準誤差の計算例
人の生徒の標本があり、テストの平均点が 、標本標準偏差が だとします。
このとき、平均の標準誤差の推定値は
となります。
大事なのは解釈です。値が だからといって、ほとんどの生徒の点数が 点の前後 点以内にある、という意味ではありません。それは標準誤差と標準偏差を混同しています。
そうではなく、同じ母集団から 人の似たような無作為標本を何度も取ると、標本平均は標本ごとにおよそ 点程度ずつ変動する、という意味です。
なぜ公式に が入るのか
分母の は、標本サイズが大きいほど平均の推定が精密になる理由を示しています。標本サイズが増えると分母が大きくなるので、標準誤差は小さくなります。
ただし、その変化は比例的ではありません。標準誤差を半分にしたいなら、通常は標本サイズを約4倍にする必要があります。なぜなら、
だからです。
標準誤差でよくある間違い
- 標準誤差と標準偏差を同じもののように扱うこと。
- 標準誤差が小さいから、生データのばらつきも小さいと言ってしまうこと。標準偏差も小さいと分からない限り、その結論は導けません。
- ここでの という式が、標本平均に特有の式であることを忘れること。
- 標本サイズが大きければ、いつでも偏りが解消されると思い込むこと。 が大きいと無作為な標本抽出による変動は小さくなりますが、偏った標本が自動的に修正されるわけではありません。
標準誤差はいつ使うのか
標準誤差は、推定値がどれくらい精密かを判断したいときに重要です。信頼区間、仮説検定、回帰分析の出力、調査結果などで現れます。
どの場合でも考え方は同じです。標準誤差は、1つの標本から得られた推定値にどれくらいの不確かさがあるかを結びつける役割を果たします。
似た問題に挑戦してみよう
、 として自分で計算してみましょう。まず平均の標準誤差を求め、そのあと の場合と比べてみてください。標本サイズが精度をどう変えるかを手早く確認できます。さらに進みたいなら、次は信頼区間を調べて、標準誤差がその幅にどう影響するかを見てみましょう。