平均とは、複数の値の集まりを1つの数で要約したものです。学校では「平均」というと算術平均を指すことが多いですが、加重平均や移動平均のほうが適している場合もあります。なぜなら、それぞれが答える問いが異なるからです。
すべての値を同じ重みで扱いたいときは、算術平均を使います。ある値を他より重く扱いたいときは、加重平均を使います。データが時間順に並んでいて、短期的な上下の動きをなだらかに見たいときは、移動平均を使います。
算術平均:すべての値を同じように数えるときに使う
算術平均は、ふつう「平均」と呼ばれるものです。
これは、各観測値が同じだけ結果に影響するべきときに使えます。もし、ある値を別の値より重く扱うべきなら、算術平均は適切な要約ではありません。
平均はデータ内のすべての値を使うので、便利で、集団どうしの比較もしやすいです。一方で、外れ値の影響を受けやすいため、極端に大きい値や小さい値が1つあるだけで、典型的な値から大きくずれることがあります。
加重平均:値によって重要さが異なるときに使う
加重平均では、値ごとに異なる重要さを与えます。
ここで、 は値、 はその重みです。重みが大きいほど、その値は結果により強く影響します。
これは、問題の条件として「ある部分のほうが重要」と決まっているときに適した方法です。成績の評価項目、保有割合で重みづけした投資収益率、数量を考慮した平均価格などは、この考え方に当てはまります。
1つ大事な条件があります。重みの合計 は であってはいけません。また、重みが実際に表したい状況に合っているときにだけ、その結果は意味を持ちます。
移動平均:時間に沿ったデータをなだらかに見るために使う
移動平均は、時間順に並んだデータに使います。データ全体を一度に平均するのではなく、直近の値を一定の幅で区切って、その区間ごとに平均を取ります。
窓の長さが の単純移動平均は、次のように表されます。
これにより、ばらつきの大きいデータをなだらかにして、短期的な傾向を見やすくできます。ただし、変動そのものを消すわけではなく、未来を予測するものでもありません。選んだ窓を使って、直近のデータを要約しているだけです。
窓の長さは重要です。窓を変えれば、移動平均の値も変わります。一般に、窓が長いほど反応が遅くなるため、よりなめらかに見えます。
違いがわかる1つの計算例
ある生徒の5週間の練習テストの点数が、、、、、 だったとします。
5週間全体の平均を1つ求めたいなら、算術平均を使います。
したがって、算術平均は です。
次に、先生が最近の取り組みをより重く評価したいとして、重みを とします。このとき、加重平均は
となります。したがって、加重平均は です。新しい点数のほうが重く扱われるので、結果は高くなります。
一方、最近の傾向をなだらかに見たいなら、直近3週間について 週間移動平均を使います。
これは、コース全体の平均点の代わりになるものではありません。答えている問いが違うのです。つまり、「最近の成績はどのように推移しているか」を見ています。
同じ5つの数から、3種類の異なる平均が得られました。なぜなら、目的が変わったからです。これが、適切な平均を選ぶときの大切な考え方です。
平均を扱うときによくある間違い
すでに重みがあるデータに算術平均を使う
テストの評価項目、数量、割合などで重要さが異なるなら、単純な平均は誤解を招くことがあります。等しい重みでよいのは、すべての値が同じだけ寄与すべき場合だけです。
元の重みを無視して平均どうしを平均する
あるクラスが 人、別のクラスが 人なら、ふつうは2つのクラス平均を同じ大きさの集団として単純に平均することはできません。元の人数や重みが必要です。
重みの合計で割るのを忘れる
加重平均では、値に重みを掛けるだけでは不十分です。最後に で割らなければなりません。
窓の長さを示さずに移動平均と言う
移動平均は、どの窓を使ったかを示さないと不完全です。 日移動平均と 日移動平均は、同じものとして扱えません。
それぞれの平均を使う場面
算術平均は、テストの点数、測定値、その他のように、すべての観測値を同じように数えるべきデータに使います。
加重平均は、成績の評価項目や販売数量のように、問題の条件として重要さがすでに決まっているときに使います。
移動平均は、気温、売上、交通量、学習の進み具合のような時系列データで、値が期間ごとに大きく上下するときに使います。
似た問題に挑戦してみよう
自分の学習データや作業データから5つの数を選んでみましょう。まず算術平均を求め、次に最後の2つの値を2倍にした加重平均を求め、最後に直近の区間について 個の値の移動平均を求めます。この簡単な比較をすると、自分の問題に本当に必要な平均の種類が見えやすくなります。