Sai số chuẩn cho biết một ước lượng từ mẫu thường thay đổi bao nhiêu từ mẫu ngẫu nhiên này sang mẫu ngẫu nhiên khác. Trên trang này, ước lượng đó là trung bình mẫu. Nó đo mức biến thiên lấy mẫu điển hình của trung bình, không phải độ phân tán của dữ liệu gốc.

Đối với trung bình mẫu, sai số chuẩn là

SE(xˉ)=σnSE(\bar{x}) = \frac{\sigma}{\sqrt{n}}

nếu độ lệch chuẩn tổng thể σ\sigma đã biết. Trong thực tế, σ\sigma thường không biết, nên ta ước lượng bằng độ lệch chuẩn mẫu ss:

SE(xˉ)snSE(\bar{x}) \approx \frac{s}{\sqrt{n}}

Công thức này áp dụng cho trung bình trong thiết lập thông thường: các quan sát được xem là một mẫu ngẫu nhiên độc lập, và bạn đang xét độ chính xác của trung bình mẫu. Sai số chuẩn càng nhỏ thì ước lượng càng chính xác.

Sai số chuẩn thực sự đo điều gì

Sai số chuẩn nói về một ước lượng, không phải về từng quan sát riêng lẻ. Nếu bạn tiếp tục lấy các mẫu mới có cùng kích thước từ cùng một tổng thể, trung bình mẫu sẽ dao động. Sai số chuẩn mô tả độ lớn điển hình của sự dao động đó.

Đó là lý do sai số chuẩn nhỏ đi khi nn lớn hơn. Lấy trung bình của nhiều quan sát hơn thường làm cho trung bình mẫu ổn định hơn giữa các mẫu, giả sử quy trình thu thập dữ liệu vẫn tương đương.

Sai số chuẩn so với độ lệch chuẩn

Đây là điểm khác biệt gây nhầm lẫn nhiều nhất. Độ lệch chuẩn mô tả mức độ phân tán của các giá trị dữ liệu trong một bộ dữ liệu. Sai số chuẩn mô tả mức độ phân tán của một thống kê, chẳng hạn như trung bình mẫu, qua nhiều lần lấy mẫu lặp lại.

Đối với trung bình, hai đại lượng này liên hệ với nhau bởi

SE(xˉ)snSE(\bar{x}) \approx \frac{s}{\sqrt{n}}

khi bạn đang ước lượng từ một mẫu. Vì vậy, sai số chuẩn có dùng độ lệch chuẩn, nhưng chúng trả lời những câu hỏi khác nhau.

Hãy dùng mẹo nhớ này:

  1. Độ lệch chuẩn hỏi: "Các giá trị dữ liệu phân tán đến mức nào?"
  2. Sai số chuẩn hỏi: "Trung bình mẫu của tôi chính xác đến mức nào với vai trò là một ước lượng?"

Một ví dụ có lời giải về sai số chuẩn

Giả sử một mẫu gồm n=25n = 25 học sinh có điểm kiểm tra trung bình là 7878 và độ lệch chuẩn mẫu là 1010.

Sai số chuẩn ước lượng của trung bình là

SE(xˉ)sn=1025=105=2SE(\bar{x}) \approx \frac{s}{\sqrt{n}} = \frac{10}{\sqrt{25}} = \frac{10}{5} = 2

Điểm quan trọng là cách diễn giải. Giá trị 22 không có nghĩa là đa số học sinh nằm trong khoảng 22 điểm quanh 7878. Cách hiểu đó là nhầm sai số chuẩn với độ lệch chuẩn.

Thay vào đó, nó có nghĩa là nếu bạn lặp lại việc lấy các mẫu ngẫu nhiên tương tự gồm 2525 học sinh từ cùng một tổng thể, thì trung bình mẫu thường sẽ thay đổi khoảng 22 điểm từ mẫu này sang mẫu khác.

Vì sao công thức dùng n\sqrt{n}

n\sqrt{n} ở mẫu số giải thích vì sao mẫu lớn hơn cho ước lượng trung bình chính xác hơn. Nếu cỡ mẫu tăng, mẫu số tăng, nên sai số chuẩn giảm.

Nhưng sự thay đổi này không tuyến tính. Để giảm sai số chuẩn xuống một nửa, bạn thường cần cỡ mẫu lớn gấp khoảng bốn lần, vì

14n=12n\frac{1}{\sqrt{4n}} = \frac{1}{2\sqrt{n}}

Những lỗi thường gặp về sai số chuẩn

  1. Dùng sai số chuẩn và độ lệch chuẩn như thể chúng có thể thay thế cho nhau.
  2. Nói rằng sai số chuẩn nhỏ có nghĩa là dữ liệu gốc ít phân tán. Kết luận đó không đúng trừ khi bạn cũng biết độ lệch chuẩn là nhỏ.
  3. Quên rằng công thức SE(xˉ)s/nSE(\bar{x}) \approx s/\sqrt{n} ở đây áp dụng riêng cho trung bình mẫu.
  4. Cho rằng mẫu lớn hơn luôn sửa được độ chệch. nn lớn hơn làm giảm biến thiên ngẫu nhiên do lấy mẫu, nhưng không tự động sửa một mẫu bị chệch.

Khi nào dùng sai số chuẩn

Sai số chuẩn quan trọng khi bạn muốn đánh giá một ước lượng chính xác đến mức nào. Nó xuất hiện trong khoảng tin cậy, kiểm định giả thuyết, kết quả hồi quy và kết quả khảo sát.

Trong mỗi trường hợp, ý tưởng đều giống nhau: sai số chuẩn giúp liên hệ một mẫu với mức độ không chắc chắn của ước lượng được tạo ra từ mẫu đó.

Thử một bài tương tự

Hãy thử phiên bản của riêng bạn với s=12s = 12n=36n = 36. Tính sai số chuẩn của trung bình, rồi so sánh với trường hợp n=144n = 144. Đây là cách nhanh để thấy cỡ mẫu làm thay đổi độ chính xác như thế nào. Nếu muốn đi xa hơn, hãy tìm hiểu tiếp về khoảng tin cậy và xem sai số chuẩn ảnh hưởng đến độ rộng của nó ra sao.

Cần trợ giúp giải bài?

Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.

Mở GPAI Solver →