中央値とは、数を小さい順に並べたときの真ん中の値です。求めるには、まず数を順番に並べ、その中心を見ます。データの個数が奇数なら真ん中の1つの値、偶数なら真ん中の2つの値の平均が中央値です。
どの場合にも使える、暗記用の特別な中央値の公式があるわけではありません。求め方は、データの個数が奇数か偶数かで決まります。
ここで、 と は並べ替えたリストの中央にある2つの値です。
3ステップで中央値を求める方法
- 数を小さい順に並べます。
- リストに値がいくつあるか数えます。
- 個数が奇数なら真ん中の値を取り、偶数なら中央の2つの値の平均を求めます。
生徒が最も見落としやすいのは、並べ替えることです。並べ替えていなければ、「真ん中」という言葉には正確な意味がありません。
偶数個のデータの中央値の例
の中央値を求めます。
この数列はすでに小さい順に並んでいます。値は 個あるので、個数は偶数です。したがって、中央値は中央の2つの値の平均になります。
中央の2つの値は と なので、
したがって、中央値は です。 や は他の値よりかなり大きいですが、中央に来る2つの値そのものは変わりません。
なぜ中央値が重要なのか
中央値は、データセットの中心に何があるかを示します。並べ替えたリストでは、値のおよそ半分が一方の側にあり、残りのおよそ半分がもう一方の側にあります。
そのため、1つか2つの値が極端に大きい、または小さいときに中央値は役立ちます。そうした外れた値は平均値を大きく動かすことがありますが、中央値への影響はそれより小さいことが多いです。
このため、平均値だけでなく、所得の中央値、住宅価格の中央値、応答時間の中央値などがよく使われます。
奇数個のリストと偶数個のリスト
リストの値が奇数個なら、真ん中にくる値は1つだけです。値が偶数個なら、真ん中の項目は1つに決まらないので、数値データでは中央の2つの値の平均を取ります。
ただし、この平均を取るルールは数に対して使うものです。データが順序だけあるカテゴリの場合、真ん中の位置については考えられても、中央の2項目を平均することには意味がありません。
中央値を求めるときによくある間違い
- 先に並べ替えないこと。 では、書かれた順の3番目の数が中央値ではありません。 と並べ替えると、中央値は です。
- 中央値と平均値を混同すること。平均値はすべての値を使って平均しますが、中央値は並べ替えたリストの中央の位置だけを使います。
- 偶数個の数値データで中央の数を1つだけ選んでしまうこと。必要なのは中央の2つの値と、その平均です。
- 中央値は必ず元のリストに含まれると思い込むこと。 では、中央値は で、これはリスト中のどの値でもありません。
どんなときに中央値を使うか
典型的な真ん中の値を知りたくて、データに外れ値や偏りがあるかもしれないときは、中央値を使います。統計学や経済学、また少数の非常に大きい値や非常に小さい値が平均値をゆがめる可能性のある日常的な要約でよく使われます。
似た問題に挑戦してみよう
の中央値を求め、次に の中央値を求めてみましょう。変わったのは値の個数だけなので、真ん中を決める手順で何が変わるかに注目してください。さらに進めたいなら、それぞれの中央値を平均値と比べて、どちらの指標のほうが大きく動くかを見てみましょう。