표준편차는 데이터 값들이 평균에서 보통 어느 정도 떨어져 있는지를 나타냅니다. 표준편차가 작으면 값들이 중심에 가깝게 모여 있다는 뜻입니다. 표준편차가 크면 데이터가 더 넓게 퍼져 있다는 뜻입니다. 결과가 원래 단위로 그대로 표현되기 때문에, 보통 분산보다 해석하기가 더 쉽습니다.
위젯으로 퍼짐 비교하기
먼저 퍼짐 슬라이더를 움직이고, 그다음 중심을 옮긴 뒤, 마지막으로 이상치를 추가해 보세요. 어떤 변화가 표준편차에 영향을 주는지, 또 어떤 변화는 데이터 전체를 그냥 이동시키기만 하는지 살펴보세요.
표준편차가 알려 주는 것
표준편차가 이 되는 경우는 모든 값이 완전히 같을 때뿐입니다. 그 외에는 "작다" 또는 "크다"를 가르는 보편적인 기준이 없습니다. 이 값은 데이터셋의 규모와 비교해서만 의미가 있습니다.
예를 들어, 표준편차가 점이면 점 만점 시험에서는 작게 느껴질 수 있습니다. 하지만 표준편차가 초라면 짧은 거리 경주에서는 크게 느껴질 수 있습니다. 맥락이 중요합니다.
모집단 표준편차와 표본 표준편차
설명하려는 전체 집단이 데이터에 모두 포함되어 있을 때만 모집단 공식을 사용합니다. 더 큰 모집단을 추정하기 위한 표본 데이터라면, 대신 표본 공식을 사용해야 합니다.
전체 모집단의 경우:
표본의 경우:
이 보정은 표본인 경우에만 중요합니다. 표본평균 가 같은 데이터에서 추정되었다는 사실을 보정해 주기 때문입니다.
예제: 평균은 같고 퍼짐은 다른 경우
다음 두 데이터셋을 비교해 봅시다.
- 집합 A:
- 집합 B:
두 집합의 평균은 모두 입니다. 하지만 집합 B가 더 넓게 퍼져 있으므로, 표준편차도 더 커야 합니다.
집합 A에서 평균으로부터의 편차는 입니다. 이를 제곱하면 이고, 합은 입니다. 이 집합을 모집단으로 보면 분산은 이므로, 표준편차는
집합 B에서 편차는 입니다. 이를 제곱하면 이고, 합은 입니다. 모집단 분산은 이므로, 표준편차는
평균은 같지만 퍼짐은 다릅니다. 바로 그것이 표준편차의 역할입니다.
탐색기에서 주목할 점
- 모든 값을 같은 양만큼 이동하면 평균은 바뀌지만 표준편차는 바뀌지 않습니다.
- 값들이 평균에서 더 멀어질수록 표준편차는 커집니다.
- 편차를 제곱하기 때문에, 하나의 이상치만으로도 결과가 크게 달라질 수 있습니다.
직접 해 보기
평균이 같은 두 데이터셋을 직접 만들어 탐색기에서 시험해 보세요. 중심은 고정한 채 퍼짐을 넓혀 보고, 표준편차가 예상한 대로 변하는지 확인해 보세요.