Khoảng tin cậy — Công thức, Cách tính & Ví dụ

Khoảng tin cậy là một khoảng giá trị hợp lý cho một tham số tổng thể, dựa trên dữ liệu mẫu. Trong nhiều bài thống kê nhập môn, nó được viết dưới dạng

\text{estimate} \pm \text{margin of error}

Sai số biên phụ thuộc vào mức độ bất định trong mẫu và mức độ tin cậy bạn muốn có. Mức tin cậy cao hơn cho khoảng rộng hơn. Dữ liệu chính xác hơn cho khoảng hẹp hơn.

Khoảng tin cậy có nghĩa là gì theo cách dễ hiểu

Nếu bạn thấy một khoảng tin cậy $95\%$ , cách diễn giải an toàn nhất là nói về phương pháp, không phải về một khoảng cụ thể đã tính xong. Nếu cùng một quy trình lấy mẫu được lặp lại nhiều lần và khoảng được dựng lại theo cùng một cách mỗi lần, thì khoảng $95\%$ trong số các khoảng đó sẽ chứa tham số thật.

Vì vậy, khoảng tin cậy là một cách thể hiện độ bất định quanh một ước lượng. Nó cho một khoảng giá trị hợp lý, không phải một sự đảm bảo.

Công thức khoảng tin cậy

Cấu trúc tổng quát là

\text{estimate} \pm \text{critical value} \times \text{standard error}

Với trung bình tổng thể, có hai dạng thường gặp:

\bar{x} \pm z^* \frac{\sigma}{\sqrt{n}}

Dùng dạng này khi độ lệch chuẩn tổng thể $\sigma$ đã biết, hoặc khi phép xấp xỉ chuẩn với giá trị tới hạn $z$ là hợp lý.

\bar{x} \pm t^* \frac{s}{\sqrt{n}}

Dùng dạng này khi $\sigma$ chưa biết và bạn ước lượng độ phân tán bằng độ lệch chuẩn mẫu $s$ . Với mẫu nhỏ, công thức này thường đi kèm điều kiện rằng tổng thể có phân phối xấp xỉ chuẩn.

Mẫu hình này xuất hiện trong nhiều tình huống, nhưng sai số chuẩn sẽ thay đổi đối với trung bình, tỷ lệ và các tham số khác.

Những yếu tố làm thay đổi độ rộng của khoảng tin cậy

Ba yếu tố quan trọng nhất là:

Mức tin cậy lớn hơn làm khoảng rộng hơn.
Cỡ mẫu lớn hơn thường làm khoảng hẹp hơn.
Dữ liệu biến thiên nhiều hơn làm khoảng rộng hơn.

Đó là sự đánh đổi chính: độ tin cậy cao hơn thường phải đánh đổi bằng độ chính xác thấp hơn.

Ví dụ về khoảng tin cậy 95%

Giả sử một mẫu gồm $64$ quan sát có trung bình $\bar{x} = 50$ , và độ lệch chuẩn tổng thể được biết là $\sigma = 8$ . Hãy lập khoảng tin cậy $95\%$ cho trung bình tổng thể bằng khoảng $z$ .

Bắt đầu với

\bar{x} \pm z^* \frac{\sigma}{\sqrt{n}}

Với mức tin cậy $95\%$ , dùng $z^* \approx 1.96$ .

Bây giờ tính sai số chuẩn:

\frac{\sigma}{\sqrt{n}} = \frac{8}{\sqrt{64}} = \frac{8}{8} = 1

Vậy sai số biên là

1.96 \times 1 = 1.96

Lập khoảng:

50 \pm 1.96

ta được

(48.04,\ 51.96)

Cách hiểu thực tế là: nếu các điều kiện của mô hình là hợp lý và dữ liệu đến từ quy trình lấy mẫu này, thì các giá trị từ $48.04$ đến $51.96$ là hợp lý đối với trung bình tổng thể.

Những lỗi thường gặp với khoảng tin cậy

Một lỗi phổ biến là nói rằng có xác suất $95\%$ để tham số thật nằm trong khoảng cụ thể này. Trong thống kê tần suất luận chuẩn, tham số là cố định, còn quy trình tạo khoảng mới là thứ có tỷ lệ thành công dài hạn.

Một lỗi khác là dùng sai công thức mà không kiểm tra điều kiện. Khoảng $z$ , khoảng $t$ và khoảng cho tỷ lệ không dùng cùng một sai số chuẩn.

Sinh viên cũng hay nhầm khoảng tin cậy cho một tham số với độ phân tán của dữ liệu thô. Khoảng tin cậy nói về độ bất định của một ước lượng, không phải về nơi mà phần lớn các quan sát riêng lẻ rơi vào.

Khi nào khoảng tin cậy được sử dụng

Khoảng tin cậy xuất hiện trong thăm dò ý kiến, thí nghiệm, kiểm soát chất lượng, y học, kinh tế học và các báo cáo dữ liệu hằng ngày. Chúng hữu ích bất cứ khi nào một mẫu được dùng để nói điều gì đó về một tổng thể lớn hơn.

Trong thực tế, khoảng này quan trọng nhất khi bạn so sánh nó với một giá trị mục tiêu hoặc với một ước lượng khác. Một khoảng hẹp hỗ trợ kết luận chính xác hơn so với một khoảng rộng.

Thử một bài tương tự

Hãy thử phiên bản của riêng bạn với $\bar{x} = 72$ , $\sigma = 10$ , và $n = 100$ cho một khoảng tin cậy $95\%$ . Sau đó chỉ thay đổi cỡ mẫu và quan sát điều gì xảy ra với sai số biên. Đây là một trong những cách nhanh nhất để hình thành trực giác về lý do vì sao mẫu lớn hơn thường tạo ra các khoảng hẹp hơn.

Câu hỏi thường gặp

Nói đơn giản thì khoảng tin cậy là gì?: Khoảng tin cậy là một khoảng giá trị hợp lý cho một tham số tổng thể, dựa trên dữ liệu mẫu. Nó kết hợp một ước lượng điểm với sai số biên.
Khoảng tin cậy 95% có nghĩa là có 95% khả năng giá trị thật nằm trong khoảng này không?: Không theo cách diễn giải tần suất luận thông thường. Nó có nghĩa là nếu cùng một quy trình lấy mẫu được lặp lại nhiều lần và mỗi lần đều xây dựng khoảng theo cùng một cách, thì khoảng 95% các khoảng đó sẽ chứa tham số thật.
Công thức cơ bản của khoảng tin cậy là gì?: Cấu trúc tổng quát là ước lượng $\pm$ giá trị tới hạn $\times$ sai số chuẩn. Giá trị tới hạn và sai số chuẩn cụ thể phụ thuộc vào tham số và các giả định.

Cần trợ giúp giải bài?

Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.

Mở GPAI Solver →