표준오차는 표본으로 구한 추정치가 한 무작위 표본에서 다른 무작위 표본으로 바뀔 때 보통 얼마나 달라지는지를 알려줍니다. 이 페이지에서 그 추정치는 표본평균입니다. 즉, 원자료의 퍼짐이 아니라 평균의 전형적인 표집 변동을 측정합니다.
표본평균의 표준오차는 모집단 표준편차 를 알고 있을 때
입니다. 실제로는 를 모르는 경우가 많으므로, 보통 표본표준편차 로 추정하여
를 사용합니다.
이 공식은 일반적인 상황에서의 평균에 대한 공식입니다. 즉, 관측값이 서로 독립인 무작위 표본이라고 보고, 표본평균이 얼마나 정확한지를 묻는 경우입니다. 표준오차가 작을수록 추정은 더 정밀합니다.
표준오차가 실제로 측정하는 것
표준오차는 개별 관측값이 아니라 추정치에 대한 개념입니다. 같은 모집단에서 같은 크기의 새 표본을 계속 뽑는다면 표본평균은 조금씩 달라집니다. 표준오차는 그 변화의 전형적인 크기를 설명합니다.
그래서 이 커질수록 표준오차는 작아집니다. 데이터 수집 방식이 비슷하게 유지된다는 가정 아래, 더 많은 관측값을 평균내면 표본평균은 표본마다 더 안정적이 되는 경우가 많습니다.
표준오차 vs 표준편차
이 구분이 가장 자주 혼동되는 부분입니다. 표준편차는 하나의 데이터 집합 안에서 값들이 얼마나 퍼져 있는지를 나타냅니다. 반면 표준오차는 표본평균 같은 통계량이 반복 표집에서 얼마나 퍼질지를 나타냅니다.
평균의 경우, 표본으로 추정할 때 두 값은
로 연결됩니다. 즉, 표준오차는 표준편차를 사용하지만, 두 값이 답하는 질문은 서로 다릅니다.
다음처럼 기억하면 쉽습니다.
- 표준편차는 "데이터 값들이 얼마나 퍼져 있는가?"를 묻습니다.
- 표준오차는 "내 표본평균은 추정치로서 얼마나 정밀한가?"를 묻습니다.
표준오차 계산 예제 하나
예를 들어, 학생 명의 표본에서 시험 점수 평균이 이고 표본표준편차가 이라고 합시다.
이때 평균의 추정 표준오차는
입니다.
핵심은 해석입니다. 값 는 대부분의 학생 점수가 점에서 점 안에 있다는 뜻이 아닙니다. 그렇게 해석하면 표준오차와 표준편차를 혼동한 것입니다.
대신, 같은 모집단에서 학생 25명을 비슷한 방식으로 반복해서 무작위 추출한다면, 표본평균은 표본마다 보통 약 점 정도 달라진다는 뜻입니다.
공식에 이 들어가는 이유
분모의 은 왜 표본이 커질수록 평균 추정이 더 정밀해지는지를 설명합니다. 표본 크기가 커지면 분모도 커지므로 표준오차는 작아집니다.
하지만 그 변화는 선형적이지 않습니다. 표준오차를 절반으로 줄이려면 보통 표본 크기를 약 4배로 늘려야 합니다. 왜냐하면
이기 때문입니다.
표준오차에서 자주 하는 실수
- 표준오차와 표준편차를 서로 바꿔 써도 되는 것처럼 사용하는 것
- 표준오차가 작으면 원자료의 퍼짐도 작다고 말하는 것. 표준편차도 작다는 정보를 함께 알지 못하면 그런 결론은 나올 수 없습니다.
- 여기서의 공식 이 표본평균에 대한 공식이라는 점을 잊는 것
- 표본이 크면 항상 편향이 해결된다고 가정하는 것. 이 커지면 무작위 표집 변동은 줄어들지만, 편향된 표본이 자동으로 바로잡히는 것은 아닙니다.
표준오차는 언제 쓰일까
표준오차는 추정치가 얼마나 정밀한지 판단하고 싶을 때 중요합니다. 신뢰구간, 가설검정, 회귀분석 결과, 설문조사 결과 등에서 자주 등장합니다.
각 경우의 핵심 아이디어는 같습니다. 표준오차는 하나의 표본과, 그 표본에서 나온 추정치의 불확실성을 연결해 줍니다.
비슷한 문제를 직접 해보기
이번에는 , 으로 직접 계산해 보세요. 평균의 표준오차를 구한 뒤, 인 경우와 비교해 보세요. 표본 크기가 정밀도를 어떻게 바꾸는지 빠르게 확인할 수 있습니다. 더 나아가고 싶다면 다음으로 신뢰구간을 살펴보면서 표준오차가 구간의 폭에 어떤 영향을 주는지도 확인해 보세요.