표준편차는 데이터 값들이 평균에서 보통 어느 정도 떨어져 있는지를 나타냅니다. 표준편차가 작으면 값들이 중심에 가깝게 모여 있다는 뜻입니다. 표준편차가 크면 데이터가 더 넓게 퍼져 있다는 뜻입니다. 결과가 원래 단위로 그대로 표현되기 때문에, 보통 분산보다 해석하기가 더 쉽습니다.

위젯으로 퍼짐 비교하기

먼저 퍼짐 슬라이더를 움직이고, 그다음 중심을 옮긴 뒤, 마지막으로 이상치를 추가해 보세요. 어떤 변화가 표준편차에 영향을 주는지, 또 어떤 변화는 데이터 전체를 그냥 이동시키기만 하는지 살펴보세요.

Standard deviation explorer

Use the same five-point shape, then test three ideas: widening the spread makes the standard deviation grow, shifting every value together keeps it the same, and an outlier can change it fast.

Formula
Number line

Each dot is one value. The red line marks the mean. Standard deviation grows when the dots sit farther from that line.

-5.44mean 05.44
Current data: -4, -2, 0, 2, 4
SummaryCount: 5Mean: 0Mode: Population standard deviationSum of squared distances: 40Variance: 40 / 5 = 8Standard deviation: 2.828
What to notice

Changing the center shifts the whole group left or right, but it does not change the spread as long as the distances between points stay the same.

An outlier can pull the mean and usually makes the standard deviation larger because one squared distance becomes much bigger than the rest.

Distances from the mean
Valuex - mean(x - mean)^2
-4-416
-2-24
000
224
4416

표준편차가 알려 주는 것

표준편차가 00이 되는 경우는 모든 값이 완전히 같을 때뿐입니다. 그 외에는 "작다" 또는 "크다"를 가르는 보편적인 기준이 없습니다. 이 값은 데이터셋의 규모와 비교해서만 의미가 있습니다.

예를 들어, 표준편차가 22점이면 100100점 만점 시험에서는 작게 느껴질 수 있습니다. 하지만 표준편차가 22초라면 짧은 거리 경주에서는 크게 느껴질 수 있습니다. 맥락이 중요합니다.

모집단 표준편차와 표본 표준편차

설명하려는 전체 집단이 데이터에 모두 포함되어 있을 때만 모집단 공식을 사용합니다. 더 큰 모집단을 추정하기 위한 표본 데이터라면, 대신 표본 공식을 사용해야 합니다.

전체 모집단의 경우:

σ=1Ni=1N(xiμ)2\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2}

표본의 경우:

s=1n1i=1n(xixˉ)2s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2}

n1n-1 보정은 표본인 경우에만 중요합니다. 표본평균 xˉ\bar{x}가 같은 데이터에서 추정되었다는 사실을 보정해 주기 때문입니다.

예제: 평균은 같고 퍼짐은 다른 경우

다음 두 데이터셋을 비교해 봅시다.

  • 집합 A: 8,9,10,11,128, 9, 10, 11, 12
  • 집합 B: 6,8,10,12,146, 8, 10, 12, 14

두 집합의 평균은 모두 1010입니다. 하지만 집합 B가 더 넓게 퍼져 있으므로, 표준편차도 더 커야 합니다.

집합 A에서 평균으로부터의 편차는 2,1,0,1,2-2, -1, 0, 1, 2입니다. 이를 제곱하면 4,1,0,1,44, 1, 0, 1, 4이고, 합은 1010입니다. 이 집합을 모집단으로 보면 분산은 10/5=210/5 = 2이므로, 표준편차는

21.41\sqrt{2} \approx 1.41

집합 B에서 편차는 4,2,0,2,4-4, -2, 0, 2, 4입니다. 이를 제곱하면 16,4,0,4,1616, 4, 0, 4, 16이고, 합은 4040입니다. 모집단 분산은 40/5=840/5 = 8이므로, 표준편차는

82.83\sqrt{8} \approx 2.83

평균은 같지만 퍼짐은 다릅니다. 바로 그것이 표준편차의 역할입니다.

탐색기에서 주목할 점

  1. 모든 값을 같은 양만큼 이동하면 평균은 바뀌지만 표준편차는 바뀌지 않습니다.
  2. 값들이 평균에서 더 멀어질수록 표준편차는 커집니다.
  3. 편차를 제곱하기 때문에, 하나의 이상치만으로도 결과가 크게 달라질 수 있습니다.

직접 해 보기

평균이 같은 두 데이터셋을 직접 만들어 탐색기에서 시험해 보세요. 중심은 고정한 채 퍼짐을 넓혀 보고, 표준편차가 예상한 대로 변하는지 확인해 보세요.

문제 풀이가 필요하신가요?

문제를 올리면 검증된 단계별 풀이를 몇 초 만에 받을 수 있습니다.

GPAI Solver 열기 →