ANOVA は analysis of variance(分散分析)の略で、複数のグループ間で平均的な結果に差があるかどうかを検定する方法です。一元配置 ANOVA では、グループ平均どうしのばらつきと、各グループ内のばらつきを比較し、その結果として 統計量が得られます。
通常これは、1つのカテゴリ変数でデータがグループに分かれ、1つの量的な応答変数があり、たくさんの 検定を個別に行う代わりに全体をまとめて1回で検定したいときに適した手法です。グループ間のばらつきがグループ内のばらつきに比べて大きければ、母平均がすべて等しいわけではないという証拠になります。
古典的な一元配置 ANOVA では、検定統計量は次のように表されます。
ここで は群間平均平方、 は群内平均平方です。 が大きいほど、グループ平均の差は単なる群内のばらつきだけでは説明しにくいことを示します。
ANOVA が検定するもの
一元配置 ANOVA の通常の帰無仮説は次のとおりです。
対立仮説は「すべての平均が異なる」という意味ではありません。もっと弱い主張であり、少なくとも1つのグループ平均が、少なくとも別の1つのグループ平均と異なるということです。
この点は重要です。ANOVA は全体としての検定だからです。有意な結果は、どこかに差がある証拠を示しますが、どのグループ間に差があるかまでは特定しません。そこを調べるには、通常は追加の比較が必要です。
なぜ ANOVA は平均の比較に分散を使うのか
名前だけ見ると最初は逆に感じるかもしれません。ANOVA は平均についての方法なのに、なぜ分散を使うのでしょうか。
それは、分散を使うと2種類のばらつきを明確に測れるからです。
- 各グループ平均が全体平均のまわりにどれだけ散らばっているか。
- 各観測値が自分のグループ平均のまわりにどれだけ散らばっているか。
1つ目のばらつきが2つ目よりずっと大きければ、グループ間の違いは、通常の群内変動だけでは生じにくいほど大きいと考えられます。
一元配置 ANOVA が適切な場面
一元配置 ANOVA は、1つのカテゴリ要因によって観測値が複数のグループに分かれ、それらのグループ間で1つの量的応答の平均を比較したいときに使います。
たとえば、指導法ごとの平均テスト得点、肥料ごとの平均収穫量、処置条件ごとの平均反応時間を比べる場合などです。
古典的な一元配置 ANOVA の主な仮定は次のとおりです。
- 観測値が独立である。
- 応答変数が量的尺度で測定されている。
- 各グループの分散がだいたい同程度である。
- 特に標本サイズが小さい場合、データの形がモデルの仮定と大きく食い違っていない。
ANOVA は多くの状況で比較的頑健に働きます。特に各グループの大きさがそろっていて、標本サイズが中程度ならそうです。ただし、それは研究デザインに依存します。データが対応のあるもの、同じ対象への反復測定、あるいは分散が大きく異なる場合には、通常の一元配置 ANOVA は適切でないことがあります。
一元配置 ANOVA の例
ある教師が、小テストの点数を使って3つの学習法を比較したいとします。
- 方法 A: , ,
- 方法 B: , ,
- 方法 C: , ,
各グループの平均は次のとおりです。
9個すべての得点に対する全体平均は
ここで、ばらつきを2つの部分に分けます。
Step 1: 群間変動
各グループには 個の観測値があるので、群間平方和は
グループ数は なので、群間の自由度は です。したがって
Step 2: 群内変動
各グループの中では、得点はグループ平均から左右に 点ずつしか離れていません。
全観測数は なので、群内の自由度は です。したがって
Step 3: 統計量を計算する
次に
を計算します。
これほど大きい の値は、グループ平均どうしの差が、各グループ内のばらつきに比べてかなり大きいことを意味します。通常の一元配置 ANOVA の仮定のもとでは、これは3つの母平均がすべて等しいという帰無仮説に対する強い反証です。
実際的には、読み取り方は単純です。3つの学習法の違いは、単なる群内のばらつきだけでは片づけられないほど大きいということです。
ANOVA でわからないこと
ANOVA だけでは、どの特定のグループの組が異なるのかはわかりません。全体として有意な結果が出た後には、通常、事後比較や計画比較が必要です。
また、効果が実用上重要だということも示しません。統計的には検出できる差でも、現実の場面では小さすぎて意味がないことがあります。
研究が無作為化されていなければ、ANOVA はグループ分けの変数が差を引き起こしたことまでは証明しません。集めたデータの中で、グループ平均が異なって見えるかどうかを検定しているだけです。
よくある ANOVA の誤解
よくある誤解の1つは、ANOVA は主にグループ分散が等しいかどうかを調べる検定だと思うことです。標準的な使い方では、ANOVA は平均を比較します。分散が出てくるのは、シグナルとノイズを測るための仕組みとして使われているからです。
もう1つの誤りは、グループが複数あるのに、1回の全体的な ANOVA ではなく、たくさんの 検定を別々に行うことです。比較の補正を慎重にしないと、これは偽陽性のリスクを高めます。
3つ目の誤りは、有意な ANOVA の結果が出た時点で止めて、どのグループが勝ったかを正確に知ったつもりになることです。全体検定だけでは、そこまではわかりません。
ANOVA が使われる分野
ANOVA は、実験、製品試験、教育、生物学、農学、社会科学でよく使われます。複数グループの平均差を、1つの妥当な検定で評価したいときに有用です。
特に、処置、方法、条件によって平均的な結果が測定可能なほど異なるのか、という比較の問いに向いています。
自分でやってみよう
同じ例で、方法 B を , , に変えてみてください。、、そして最後の 統計量を計算し直しましょう。この1か所の変更だけで、群内ノイズが大きくなるほど、平均差が本物だという証拠が弱くなるという核心的な直感が見えてきます。