z점수는 어떤 값이 평균에서 표준편차를 기준으로 얼마나 떨어져 있는지를 나타냅니다. 그래서 단순히 원점수만 보는 것이 아니라, 그 값이 집단 전체에서 어느 정도 위치에 있는지 비교할 때 유용합니다.
기본 공식은 다음과 같습니다.
여기서 는 값, 는 평균, 는 표준편차입니다.
가 양수이면 그 값은 평균보다 큽니다. 가 음수이면 그 값은 평균보다 작습니다. 이면 그 값은 정확히 평균에 있습니다.
Z점수 계산 방법
다음 순서를 따르면 됩니다.
- 값 에서 시작합니다.
- 평균을 뺍니다.
- 표준편차로 나눕니다.
계산이 하는 일은 이것뿐입니다. 평균으로부터의 원래 거리를 표준화된 거리로 바꾸는 것입니다.
공식을 직관적으로 이해하기
분자 는 그 값이 중심에서 얼마나 떨어져 있는지를 알려줍니다. 분모 는 그 거리를 데이터의 일반적인 퍼짐 정도에 맞춰 다시 조정합니다.
그래서 z점수는 단지 "이 점수는 평균보다 14점 높다"라고만 말하지 않습니다. 그 14점 차이가 해당 데이터 집합에서 작은 차이인지 큰 차이인지까지 보여줍니다.
예제 풀이
어떤 시험 점수가 , 반 평균이 , 표준편차가 이라고 해봅시다.
이 숫자들을 공식에 대입하면 다음과 같습니다.
먼저 뺄셈을 합니다.
그다음 나눗셈을 합니다.
z점수는 입니다. 이는 그 점수가 평균보다 표준편차 만큼 위에 있다는 뜻입니다.
답을 빠르게 읽는 방법
- 은 평균보다 표준편차 1만큼 위에 있다는 뜻입니다.
- 는 평균보다 표준편차 1.5만큼 아래에 있다는 뜻입니다.
- 처럼 절댓값이 더 크면 그 값이 평균에서 비교적 멀리 떨어져 있다는 뜻입니다.
이 해석은 어디까지나 사용한 평균과 표준편차를 기준으로만 성립합니다. 이 값들이 바뀌면 z점수도 함께 바뀝니다.
자주 하는 실수
흔한 실수 중 하나는 표준편차 대신 분산으로 나누는 것입니다. z점수에는 분산이 아니라 표준편차를 사용합니다.
또 다른 실수는 부호를 무시하는 것입니다. 인 z점수와 인 z점수는 같지 않습니다. 앞의 값은 평균보다 아래에 있고, 뒤의 값은 평균보다 위에 있습니다.
서로 다른 집단의 데이터를 섞어 생각하는 것도 흔한 실수입니다. 평균이나 표준편차가 달라지면 같은 점수라도 한 반에서는 하나의 z점수를, 다른 반에서는 다른 z점수를 가질 수 있습니다.
사람들이 Z점수를 사용하는 경우
z점수는 서로 다른 척도의 값을 비교하거나, 유난히 높거나 낮은 관측값을 찾거나, 원자료를 정규분포 모형과 연결할 때 유용합니다.
마지막 용도에는 조건이 있습니다. z점수를 확률로 바꾸는 해석은 정규모형이 적절할 때, 또는 문제에서 명시적으로 그렇게 하라고 할 때 가장 의미가 있습니다.
모집단 수치와 표본 수치
많은 통계 공식에서 z점수는 모집단 기호로 다음과 같이 씁니다.
만약 표본평균 와 표본표준편차 만 있다면, 보통 다음과 같이 표준화합니다.
계산 과정 자체는 같지만, 그 값들이 전체 모집단을 설명하는지 아니면 표본만 설명하는지에 따라 해석은 달라집니다.
직접 해보기
아무 값이나 평균, 표준편차를 하나씩 정한 뒤 z점수를 계산하고 그 결과를 말로 설명해 보세요. 다음 연습으로는 z점수가 음수가 되는 비슷한 문제를 풀어 보고, 해석이 부호와 여전히 일치하는지도 확인해 보세요.