Kiểm định chi bình phương

Kiểm định chi bình phương dùng để kiểm tra xem dữ liệu đếm theo nhóm có lệch quá xa so với điều mà một mô hình kỳ vọng chỉ do ngẫu nhiên hay không. Nó được dùng cho số đếm trong các nhóm, không dùng cho giá trị trung bình hay các phép đo thô.

Ý tưởng cốt lõi rất đơn giản: so sánh những gì bạn quan sát được với những gì bạn kỳ vọng nếu giả thuyết không là đúng. Nếu độ chênh đủ lớn, thống kê chi bình phương sẽ lớn, và dữ liệu được xem là bằng chứng chống lại mô hình không đó.

Kiểm định này thực sự đang so sánh điều gì

Trong thiết lập phổ biến nhất, bạn có số đếm quan sát $O$ và số đếm kỳ vọng $E$ cho mỗi nhóm. Thống kê kiểm định là

\chi^2 = \sum \frac{(O - E)^2}{E}

Giá trị này tăng lên khi số đếm quan sát lệch xa hơn khỏi số đếm kỳ vọng. Những sai khác lớn sẽ có ảnh hưởng mạnh hơn, và các nhóm có số đếm kỳ vọng lớn hơn cũng được chuẩn hóa tương ứng.

Số đếm kỳ vọng không được đoán một cách tùy tiện. Chúng xuất phát từ giả thuyết không. Với kiểm định độ phù hợp, giả thuyết không có thể nói rằng các nhóm có khả năng xuất hiện như nhau. Với kiểm định tính độc lập, giả thuyết không nói rằng hai biến phân loại không liên quan với nhau.

Hai dạng phổ biến

Cụm từ "kiểm định chi bình phương" thường chỉ một trong hai dạng sau:

Kiểm định độ phù hợp, dùng để hỏi liệu một biến phân loại có tuân theo một phân phối được nêu ra hay không.
Kiểm định tính độc lập, dùng để hỏi liệu hai biến phân loại có liên hệ với nhau trong một bảng chéo hay không.

Cùng một họ thống kê được dùng trong cả hai trường hợp, nhưng cách tính số đếm kỳ vọng sẽ phụ thuộc vào từng dạng.

Ví dụ tính toán: Kiểm định độ phù hợp

Giả sử một quán cà phê muốn biết liệu ba cỡ đồ uống có được chọn với tần suất như nhau hay không. Trong $60$ đơn hàng, số đếm quan sát là:

Nhỏ: $26$
Vừa: $18$
Lớn: $16$

Nếu giả thuyết không nói rằng cả ba cỡ đều có khả năng được chọn như nhau, thì số đếm kỳ vọng ở mỗi nhóm là

E = \frac{60}{3} = 20

Bây giờ tính thống kê:

\chi^2 = \frac{(26-20)^2}{20} + \frac{(18-20)^2}{20} + \frac{(16-20)^2}{20}

= \frac{36}{20} + \frac{4}{20} + \frac{16}{20}

= 1.8 + 0.2 + 0.8 = 2.8

Đó là thống kê kiểm định, chưa phải kết luận cuối cùng nếu chỉ xét riêng nó. Bạn sẽ so sánh $\chi^2 = 2.8$ với phân phối chi bình phương có số bậc tự do phù hợp. Ở đây số bậc tự do là $3 - 1 = 2$ , vì có ba nhóm và không có tham số nào được ước lượng từ dữ liệu. Với $df = 2$ , thống kê $2.8$ không phải là bằng chứng mạnh chống lại giả thuyết các mức ưa thích bằng nhau ở mức $5\%$ .

Cách diễn giải thực tế là: số đếm có khác so với trường hợp hoàn toàn bằng nhau, nhưng chưa đủ khác để có thể tự tin nói rằng sở thích thật sự là không bằng nhau chỉ dựa trên mẫu này.

Khi nào kiểm định này hợp lý

Hãy dùng kiểm định chi bình phương khi tất cả các điều sau đều đúng:

Dữ liệu của bạn là tập hợp các số đếm theo nhóm.
Các quan sát là độc lập, hoặc đủ gần với giả định độc lập của mô hình bạn đang dùng.
Số đếm kỳ vọng không quá nhỏ đối với phép xấp xỉ chi bình phương mà bạn định sử dụng.

Trong nhiều bối cảnh nhập môn, người ta dùng quy tắc kinh nghiệm rằng số đếm kỳ vọng nên ít nhất khoảng $5$ ở mỗi nhóm. Đây là một hướng dẫn thực hành, không phải quy luật tuyệt đối, nhưng là một dấu hiệu cảnh báo hữu ích.

Những lỗi thường gặp

Dùng kiểm định này cho giá trị trung bình, phép đo hoặc phần trăm thay vì số đếm theo nhóm.
Xem số đếm quan sát như số đếm kỳ vọng. Số đếm kỳ vọng phải xuất phát từ giả thuyết không.
Bỏ qua các số đếm kỳ vọng nhỏ, điều này có thể làm cho phép xấp xỉ chi bình phương thông thường trở nên không đáng tin cậy.
Nghĩ rằng "có ý nghĩa thống kê" đồng nghĩa với "quan trọng trong thực tế". Kiểm định này chỉ xem xét bằng chứng chống lại mô hình không.

Bạn sẽ gặp nó ở đâu

Kiểm định chi bình phương xuất hiện trong khảo sát, di truyền học, kiểm soát chất lượng, nghiên cứu thị trường và mọi bối cảnh mà kết quả rơi vào các nhóm phân loại. Nó đặc biệt phổ biến khi câu hỏi thực sự là liệu một mẫu hình có đáng ngạc nhiên hay không, hoặc liệu hai biến phân loại có vẻ liên quan với nhau hay không.

Nếu dữ liệu là dữ liệu số thay vì dữ liệu phân loại, thì thường một công cụ khác sẽ phù hợp hơn. Ví dụ, so sánh giá trị trung bình thường dẫn đến kiểm định $t$ hoặc ANOVA.

Tự thử một phiên bản của riêng bạn

Hãy lấy một bảng nhỏ gồm các số đếm theo nhóm và viết ra giả thuyết không trước khi làm bất kỳ phép tính nào. Chỉ riêng bước đó thường đã giúp tránh được lỗi lớn nhất trong các bài toán chi bình phương: dùng đúng công thức nhưng lại dùng sai số đếm kỳ vọng.

Cần trợ giúp giải bài?

Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.

Mở GPAI Solver →