ANOVA — Giải thích phân tích phương sai

ANOVA, viết tắt của analysis of variance (phân tích phương sai), kiểm định xem kết quả trung bình có khác nhau giữa nhiều nhóm hay không. Trong ANOVA một nhân tố, bạn so sánh độ biến thiên giữa các trung bình nhóm với độ biến thiên bên trong các nhóm, từ đó tạo ra thống kê $F$ .

Đây thường là công cụ phù hợp khi bạn có một biến phân nhóm dạng phân loại, một biến phản hồi định lượng, và muốn có một kiểm định tổng thể thay vì chạy nhiều kiểm định $t$ riêng lẻ. Nếu độ biến thiên giữa các nhóm lớn so với độ biến thiên trong nhóm, đó là bằng chứng cho thấy không phải mọi trung bình tổng thể đều bằng nhau.

Với ANOVA một nhân tố cổ điển, thống kê kiểm định là

F = \frac{MS_B}{MS_W}

trong đó $MS_B$ là bình phương trung bình giữa các nhóm và $MS_W$ là bình phương trung bình trong nhóm. Giá trị $F$ càng lớn thì càng cho thấy các trung bình nhóm tách biệt nhau nhiều hơn mức có thể kỳ vọng chỉ từ nhiễu thông thường trong nhóm.

ANOVA kiểm định điều gì

Giả thuyết không thường dùng cho ANOVA một nhân tố là

H_0: \mu_1 = \mu_2 = \cdots = \mu_k

Giả thuyết đối không có nghĩa là “mọi trung bình đều khác nhau”. Nó yếu hơn: có ít nhất một trung bình nhóm khác với ít nhất một trung bình nhóm khác.

Điểm này quan trọng vì ANOVA là một kiểm định tổng thể. Kết quả có ý nghĩa thống kê cho biết có bằng chứng về một khác biệt nào đó ở đâu đó, nhưng không chỉ ra nhóm nào khác nhóm nào. Việc đó thường cần các phép so sánh tiếp theo.

Vì sao ANOVA dùng phương sai để so sánh trung bình

Tên gọi này lúc đầu có vẻ ngược. Nếu ANOVA nói về trung bình, tại sao lại dùng phương sai?

Vì phương sai cho ta một cách rõ ràng để đo hai kiểu độ phân tán:

Độ phân tán của các trung bình nhóm quanh trung bình chung.
Độ phân tán của từng quan sát quanh trung bình của chính nhóm đó.

Nếu kiểu phân tán thứ nhất lớn hơn nhiều so với kiểu thứ hai, thì các nhóm có vẻ tách biệt nhau hơn mức mà dao động thông thường trong nhóm thường tạo ra.

Khi nào ANOVA một nhân tố là phù hợp

ANOVA một nhân tố được dùng khi một nhân tố phân loại chia các quan sát thành các nhóm và bạn muốn so sánh trung bình của một biến phản hồi định lượng giữa các nhóm đó.

Ví dụ gồm so sánh điểm kiểm tra trung bình giữa các phương pháp giảng dạy, năng suất cây trồng trung bình giữa các loại phân bón, hoặc thời gian phản ứng trung bình giữa các điều kiện xử lý.

Với ANOVA một nhân tố cổ điển, các giả định chính là:

Các quan sát độc lập.
Biến phản hồi được đo trên thang định lượng.
Phương sai giữa các nhóm tương đối giống nhau.
Mô hình không quá không phù hợp với dạng dữ liệu, đặc biệt khi cỡ mẫu nhỏ.

ANOVA vẫn có thể khá vững trong nhiều tình huống, nhất là khi các nhóm cân bằng và cỡ mẫu vừa phải, nhưng điều đó còn phụ thuộc vào thiết kế nghiên cứu. Nếu dữ liệu là dữ liệu cặp, lặp lại trên cùng đối tượng, hoặc có phương sai rất không đồng đều, thì ANOVA một nhân tố thông thường có thể không phải là công cụ phù hợp.

Ví dụ về ANOVA một nhân tố

Giả sử một giáo viên muốn so sánh ba phương pháp học bằng điểm bài kiểm tra ngắn:

Phương pháp A: $72$ , $74$ , $76$
Phương pháp B: $78$ , $80$ , $82$
Phương pháp C: $84$ , $86$ , $88$

Các trung bình nhóm là

\bar{x}_A = 74, \qquad \bar{x}_B = 80, \qquad \bar{x}_C = 86

Trung bình chung của cả $9$ điểm là

\bar{x} = 80

Bây giờ ta tách độ biến thiên thành hai phần.

Bước 1: Độ biến thiên giữa các nhóm

Mỗi nhóm có $3$ quan sát, nên tổng bình phương giữa các nhóm là

SS_B = 3(74-80)^2 + 3(80-80)^2 + 3(86-80)^2

SS_B = 3(36) + 0 + 3(36) = 216

Với $k=3$ nhóm, bậc tự do giữa các nhóm là $k-1=2$ , nên

MS_B = \frac{SS_B}{k-1} = \frac{216}{2} = 108

Bước 2: Độ biến thiên trong nhóm

Bên trong mỗi nhóm, các điểm chỉ lệch $2$ điểm so với trung bình nhóm ở mỗi phía:

SS_W = (4+0+4) + (4+0+4) + (4+0+4) = 24

Với tổng cộng $N=9$ quan sát, bậc tự do trong nhóm là $N-k=6$ , nên

MS_W = \frac{SS_W}{N-k} = \frac{24}{6} = 4

Bước 3: Tính thống kê $F$

Bây giờ tính

F = \frac{MS_B}{MS_W} = \frac{108}{4} = 27

Giá trị $F$ lớn như vậy có nghĩa là các trung bình nhóm cách xa nhau nhiều so với độ biến thiên bên trong các nhóm. Dưới các giả định thông thường của ANOVA một nhân tố, đây là bằng chứng mạnh chống lại giả thuyết không rằng cả ba trung bình tổng thể đều bằng nhau.

Cách diễn giải thực tế rất đơn giản: khác biệt giữa ba phương pháp học là quá lớn để chỉ xem như độ phân tán thông thường trong nhóm.

ANOVA không cho bạn biết điều gì

ANOVA không cho biết cặp nhóm cụ thể nào khác nhau. Sau một kết quả tổng thể có ý nghĩa thống kê, bạn thường cần các phép so sánh hậu nghiệm hoặc các đối lập được hoạch định trước.

Nó cũng không cho biết hiệu ứng đó có quan trọng về mặt thực tiễn hay không. Một khác biệt có thể phát hiện được về mặt thống kê vẫn có thể quá nhỏ để tạo ra ý nghĩa trong bối cảnh thực tế.

Nếu nghiên cứu không được phân nhóm ngẫu nhiên, ANOVA cũng không chứng minh rằng biến phân nhóm đã gây ra khác biệt. Nó chỉ kiểm định xem các trung bình nhóm có vẻ khác nhau trong dữ liệu bạn thu thập hay không.

Những sai lầm thường gặp với ANOVA

Một sai lầm phổ biến là nghĩ rằng ANOVA chủ yếu là kiểm định xem phương sai các nhóm có bằng nhau hay không. Trong cách dùng chuẩn, ANOVA so sánh các trung bình. Phương sai xuất hiện vì đó là công cụ dùng để đo tín hiệu so với nhiễu.

Một sai lầm khác là chạy nhiều kiểm định $t$ riêng lẻ thay vì một ANOVA tổng thể khi có nhiều nhóm. Điều đó có thể làm tăng nguy cơ dương tính giả nếu các phép so sánh không được điều chỉnh cẩn thận.

Sai lầm thứ ba là dừng lại sau khi ANOVA cho kết quả có ý nghĩa và khẳng định biết chính xác nhóm nào tốt nhất. Bản thân kiểm định tổng thể không trả lời được điều đó.

ANOVA được dùng ở đâu

ANOVA rất phổ biến trong thí nghiệm, kiểm thử sản phẩm, giáo dục, sinh học, nông nghiệp và khoa học xã hội. Nó hữu ích bất cứ khi nào bạn cần một kiểm định đáng tin cậy cho sự khác biệt trung bình giữa nhiều nhóm.

Nó đặc biệt hữu ích khi câu hỏi thực sự mang tính so sánh: các biện pháp xử lý, phương pháp hoặc điều kiện này có tạo ra các kết quả trung bình khác nhau một cách đo được hay không?

Tự thử một phiên bản của bạn

Hãy lấy cùng ví dụ đó và đổi Phương pháp B thành $79$ , $80$ , $81$ . Tính lại $SS_W$ , $MS_W$ và thống kê $F$ cuối cùng. Chỉ một thay đổi đó cũng làm trực giác cốt lõi trở nên rõ ràng: khi nhiễu trong nhóm tăng lên, bằng chứng cho một khác biệt trung bình thực sự sẽ yếu đi.

Cần trợ giúp giải bài?

Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.

Mở GPAI Solver →