표준오차는 표본으로 구한 추정치가 한 무작위 표본에서 다른 무작위 표본으로 바뀔 때 보통 얼마나 달라지는지를 알려줍니다. 이 페이지에서 그 추정치는 표본평균입니다. 즉, 원자료의 퍼짐이 아니라 평균의 전형적인 표집 변동을 측정합니다.

표본평균의 표준오차는 모집단 표준편차 σ\sigma를 알고 있을 때

SE(xˉ)=σnSE(\bar{x}) = \frac{\sigma}{\sqrt{n}}

입니다. 실제로는 σ\sigma를 모르는 경우가 많으므로, 보통 표본표준편차 ss로 추정하여

SE(xˉ)snSE(\bar{x}) \approx \frac{s}{\sqrt{n}}

를 사용합니다.

이 공식은 일반적인 상황에서의 평균에 대한 공식입니다. 즉, 관측값이 서로 독립인 무작위 표본이라고 보고, 표본평균이 얼마나 정확한지를 묻는 경우입니다. 표준오차가 작을수록 추정은 더 정밀합니다.

표준오차가 실제로 측정하는 것

표준오차는 개별 관측값이 아니라 추정치에 대한 개념입니다. 같은 모집단에서 같은 크기의 새 표본을 계속 뽑는다면 표본평균은 조금씩 달라집니다. 표준오차는 그 변화의 전형적인 크기를 설명합니다.

그래서 nn이 커질수록 표준오차는 작아집니다. 데이터 수집 방식이 비슷하게 유지된다는 가정 아래, 더 많은 관측값을 평균내면 표본평균은 표본마다 더 안정적이 되는 경우가 많습니다.

표준오차 vs 표준편차

이 구분이 가장 자주 혼동되는 부분입니다. 표준편차는 하나의 데이터 집합 안에서 값들이 얼마나 퍼져 있는지를 나타냅니다. 반면 표준오차는 표본평균 같은 통계량이 반복 표집에서 얼마나 퍼질지를 나타냅니다.

평균의 경우, 표본으로 추정할 때 두 값은

SE(xˉ)snSE(\bar{x}) \approx \frac{s}{\sqrt{n}}

로 연결됩니다. 즉, 표준오차는 표준편차를 사용하지만, 두 값이 답하는 질문은 서로 다릅니다.

다음처럼 기억하면 쉽습니다.

  1. 표준편차는 "데이터 값들이 얼마나 퍼져 있는가?"를 묻습니다.
  2. 표준오차는 "내 표본평균은 추정치로서 얼마나 정밀한가?"를 묻습니다.

표준오차 계산 예제 하나

예를 들어, 학생 n=25n = 25명의 표본에서 시험 점수 평균이 7878이고 표본표준편차가 1010이라고 합시다.

이때 평균의 추정 표준오차는

SE(xˉ)sn=1025=105=2SE(\bar{x}) \approx \frac{s}{\sqrt{n}} = \frac{10}{\sqrt{25}} = \frac{10}{5} = 2

입니다.

핵심은 해석입니다. 값 22는 대부분의 학생 점수가 7878점에서 ±2\pm 2점 안에 있다는 뜻이 아닙니다. 그렇게 해석하면 표준오차와 표준편차를 혼동한 것입니다.

대신, 같은 모집단에서 학생 25명을 비슷한 방식으로 반복해서 무작위 추출한다면, 표본평균은 표본마다 보통 약 22점 정도 달라진다는 뜻입니다.

공식에 n\sqrt{n}이 들어가는 이유

분모의 n\sqrt{n}은 왜 표본이 커질수록 평균 추정이 더 정밀해지는지를 설명합니다. 표본 크기가 커지면 분모도 커지므로 표준오차는 작아집니다.

하지만 그 변화는 선형적이지 않습니다. 표준오차를 절반으로 줄이려면 보통 표본 크기를 약 4배로 늘려야 합니다. 왜냐하면

14n=12n\frac{1}{\sqrt{4n}} = \frac{1}{2\sqrt{n}}

이기 때문입니다.

표준오차에서 자주 하는 실수

  1. 표준오차와 표준편차를 서로 바꿔 써도 되는 것처럼 사용하는 것
  2. 표준오차가 작으면 원자료의 퍼짐도 작다고 말하는 것. 표준편차도 작다는 정보를 함께 알지 못하면 그런 결론은 나올 수 없습니다.
  3. 여기서의 공식 SE(xˉ)s/nSE(\bar{x}) \approx s/\sqrt{n}이 표본평균에 대한 공식이라는 점을 잊는 것
  4. 표본이 크면 항상 편향이 해결된다고 가정하는 것. nn이 커지면 무작위 표집 변동은 줄어들지만, 편향된 표본이 자동으로 바로잡히는 것은 아닙니다.

표준오차는 언제 쓰일까

표준오차는 추정치가 얼마나 정밀한지 판단하고 싶을 때 중요합니다. 신뢰구간, 가설검정, 회귀분석 결과, 설문조사 결과 등에서 자주 등장합니다.

각 경우의 핵심 아이디어는 같습니다. 표준오차는 하나의 표본과, 그 표본에서 나온 추정치의 불확실성을 연결해 줍니다.

비슷한 문제를 직접 해보기

이번에는 s=12s = 12, n=36n = 36으로 직접 계산해 보세요. 평균의 표준오차를 구한 뒤, n=144n = 144인 경우와 비교해 보세요. 표본 크기가 정밀도를 어떻게 바꾸는지 빠르게 확인할 수 있습니다. 더 나아가고 싶다면 다음으로 신뢰구간을 살펴보면서 표준오차가 구간의 폭에 어떤 영향을 주는지도 확인해 보세요.

문제 풀이가 필요하신가요?

문제를 올리면 검증된 단계별 풀이를 몇 초 만에 받을 수 있습니다.

GPAI Solver 열기 →