표준편차 | GPAI STEM

표준편차는 데이터 값들이 평균에서 보통 어느 정도 떨어져 있는지를 나타냅니다. 표준편차가 작으면 값들이 중심에 가깝게 모여 있다는 뜻입니다. 표준편차가 크면 데이터가 더 넓게 퍼져 있다는 뜻입니다. 결과가 원래 단위로 그대로 표현되기 때문에, 보통 분산보다 해석하기가 더 쉽습니다.

위젯으로 퍼짐 비교하기

먼저 퍼짐 슬라이더를 움직이고, 그다음 중심을 옮긴 뒤, 마지막으로 이상치를 추가해 보세요. 어떤 변화가 표준편차에 영향을 주는지, 또 어떤 변화는 데이터 전체를 그냥 이동시키기만 하는지 살펴보세요.

Standard deviation explorer

Use the same five-point shape, then test three ideas: widening the spread makes the standard deviation grow, shifting every value together keeps it the same, and an outlier can change it fast.

CenterCurrent center: 0SpreadTypical distance pattern: 0, 1, and 2 spread-units from the centerOutlier offsetTurn on the outlier to move one extra point far from the mean.

Include one extra outlier point

FormulaPopulation: sqrt(sum((x - mean)^2) / n)Sample: sqrt(sum((x - mean)^2) / (n - 1))

Number line

Each dot is one value. The red line marks the mean. Standard deviation grows when the dots sit farther from that line.

Current data: -4, -2, 0, 2, 4

SummaryCount: 5Mean: 0Mode: Population standard deviationSum of squared distances: 40Variance: 40 / 5 = 8Standard deviation: 2.828

What to notice

Changing the center shifts the whole group left or right, but it does not change the spread as long as the distances between points stay the same.

An outlier can pull the mean and usually makes the standard deviation larger because one squared distance becomes much bigger than the rest.

Distances from the mean

Value	x - mean	(x - mean)^2
-4	-4	16
-2	-2	4
0	0	0
2	2	4
4	4	16

표준편차가 알려 주는 것

표준편차가 $0$ 이 되는 경우는 모든 값이 완전히 같을 때뿐입니다. 그 외에는 "작다" 또는 "크다"를 가르는 보편적인 기준이 없습니다. 이 값은 데이터셋의 규모와 비교해서만 의미가 있습니다.

예를 들어, 표준편차가 $2$ 점이면 $100$ 점 만점 시험에서는 작게 느껴질 수 있습니다. 하지만 표준편차가 $2$ 초라면 짧은 거리 경주에서는 크게 느껴질 수 있습니다. 맥락이 중요합니다.

모집단 표준편차와 표본 표준편차

설명하려는 전체 집단이 데이터에 모두 포함되어 있을 때만 모집단 공식을 사용합니다. 더 큰 모집단을 추정하기 위한 표본 데이터라면, 대신 표본 공식을 사용해야 합니다.

전체 모집단의 경우:

\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2}

표본의 경우:

s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2}

이 $n-1$ 보정은 표본인 경우에만 중요합니다. 표본평균 $\bar{x}$ 가 같은 데이터에서 추정되었다는 사실을 보정해 주기 때문입니다.

예제: 평균은 같고 퍼짐은 다른 경우

다음 두 데이터셋을 비교해 봅시다.

집합 A: $8, 9, 10, 11, 12$
집합 B: $6, 8, 10, 12, 14$

두 집합의 평균은 모두 $10$ 입니다. 하지만 집합 B가 더 넓게 퍼져 있으므로, 표준편차도 더 커야 합니다.

집합 A에서 평균으로부터의 편차는 $-2, -1, 0, 1, 2$ 입니다. 이를 제곱하면 $4, 1, 0, 1, 4$ 이고, 합은 $10$ 입니다. 이 집합을 모집단으로 보면 분산은 $10/5 = 2$ 이므로, 표준편차는

\sqrt{2} \approx 1.41

집합 B에서 편차는 $-4, -2, 0, 2, 4$ 입니다. 이를 제곱하면 $16, 4, 0, 4, 16$ 이고, 합은 $40$ 입니다. 모집단 분산은 $40/5 = 8$ 이므로, 표준편차는

\sqrt{8} \approx 2.83

평균은 같지만 퍼짐은 다릅니다. 바로 그것이 표준편차의 역할입니다.

탐색기에서 주목할 점

모든 값을 같은 양만큼 이동하면 평균은 바뀌지만 표준편차는 바뀌지 않습니다.
값들이 평균에서 더 멀어질수록 표준편차는 커집니다.
편차를 제곱하기 때문에, 하나의 이상치만으로도 결과가 크게 달라질 수 있습니다.

직접 해 보기

평균이 같은 두 데이터셋을 직접 만들어 탐색기에서 시험해 보세요. 중심은 고정한 채 퍼짐을 넓혀 보고, 표준편차가 예상한 대로 변하는지 확인해 보세요.

문제 풀이가 필요하신가요?

문제를 올리면 검증된 단계별 풀이를 몇 초 만에 받을 수 있습니다.

GPAI Solver 열기 →