Khoảng tin cậy là một khoảng giá trị hợp lý cho một tham số tổng thể, dựa trên dữ liệu mẫu. Trong nhiều bài thống kê nhập môn, nó được viết dưới dạng
Sai số biên phụ thuộc vào mức độ bất định trong mẫu và mức độ tin cậy bạn muốn có. Mức tin cậy cao hơn cho khoảng rộng hơn. Dữ liệu chính xác hơn cho khoảng hẹp hơn.
Khoảng tin cậy có nghĩa là gì theo cách dễ hiểu
Nếu bạn thấy một khoảng tin cậy , cách diễn giải an toàn nhất là nói về phương pháp, không phải về một khoảng cụ thể đã tính xong. Nếu cùng một quy trình lấy mẫu được lặp lại nhiều lần và khoảng được dựng lại theo cùng một cách mỗi lần, thì khoảng trong số các khoảng đó sẽ chứa tham số thật.
Vì vậy, khoảng tin cậy là một cách thể hiện độ bất định quanh một ước lượng. Nó cho một khoảng giá trị hợp lý, không phải một sự đảm bảo.
Công thức khoảng tin cậy
Cấu trúc tổng quát là
Với trung bình tổng thể, có hai dạng thường gặp:
Dùng dạng này khi độ lệch chuẩn tổng thể đã biết, hoặc khi phép xấp xỉ chuẩn với giá trị tới hạn là hợp lý.
Dùng dạng này khi chưa biết và bạn ước lượng độ phân tán bằng độ lệch chuẩn mẫu . Với mẫu nhỏ, công thức này thường đi kèm điều kiện rằng tổng thể có phân phối xấp xỉ chuẩn.
Mẫu hình này xuất hiện trong nhiều tình huống, nhưng sai số chuẩn sẽ thay đổi đối với trung bình, tỷ lệ và các tham số khác.
Những yếu tố làm thay đổi độ rộng của khoảng tin cậy
Ba yếu tố quan trọng nhất là:
- Mức tin cậy lớn hơn làm khoảng rộng hơn.
- Cỡ mẫu lớn hơn thường làm khoảng hẹp hơn.
- Dữ liệu biến thiên nhiều hơn làm khoảng rộng hơn.
Đó là sự đánh đổi chính: độ tin cậy cao hơn thường phải đánh đổi bằng độ chính xác thấp hơn.
Ví dụ về khoảng tin cậy 95%
Giả sử một mẫu gồm quan sát có trung bình , và độ lệch chuẩn tổng thể được biết là . Hãy lập khoảng tin cậy cho trung bình tổng thể bằng khoảng .
Bắt đầu với
Với mức tin cậy , dùng .
Bây giờ tính sai số chuẩn:
Vậy sai số biên là
Lập khoảng:
ta được
Cách hiểu thực tế là: nếu các điều kiện của mô hình là hợp lý và dữ liệu đến từ quy trình lấy mẫu này, thì các giá trị từ đến là hợp lý đối với trung bình tổng thể.
Những lỗi thường gặp với khoảng tin cậy
Một lỗi phổ biến là nói rằng có xác suất để tham số thật nằm trong khoảng cụ thể này. Trong thống kê tần suất luận chuẩn, tham số là cố định, còn quy trình tạo khoảng mới là thứ có tỷ lệ thành công dài hạn.
Một lỗi khác là dùng sai công thức mà không kiểm tra điều kiện. Khoảng , khoảng và khoảng cho tỷ lệ không dùng cùng một sai số chuẩn.
Sinh viên cũng hay nhầm khoảng tin cậy cho một tham số với độ phân tán của dữ liệu thô. Khoảng tin cậy nói về độ bất định của một ước lượng, không phải về nơi mà phần lớn các quan sát riêng lẻ rơi vào.
Khi nào khoảng tin cậy được sử dụng
Khoảng tin cậy xuất hiện trong thăm dò ý kiến, thí nghiệm, kiểm soát chất lượng, y học, kinh tế học và các báo cáo dữ liệu hằng ngày. Chúng hữu ích bất cứ khi nào một mẫu được dùng để nói điều gì đó về một tổng thể lớn hơn.
Trong thực tế, khoảng này quan trọng nhất khi bạn so sánh nó với một giá trị mục tiêu hoặc với một ước lượng khác. Một khoảng hẹp hỗ trợ kết luận chính xác hơn so với một khoảng rộng.
Thử một bài tương tự
Hãy thử phiên bản của riêng bạn với , , và cho một khoảng tin cậy . Sau đó chỉ thay đổi cỡ mẫu và quan sát điều gì xảy ra với sai số biên. Đây là một trong những cách nhanh nhất để hình thành trực giác về lý do vì sao mẫu lớn hơn thường tạo ra các khoảng hẹp hơn.
Cần trợ giúp giải bài?
Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.
Mở GPAI Solver →