평균은 여러 값의 집합을 하나의 수로 요약한 것입니다. 학교에서는 "평균"이라고 하면 보통 산술평균을 뜻하지만, 가중평균이나 이동평균이 더 적절한 경우도 있습니다. 각각이 답하는 질문이 다르기 때문입니다.
모든 값이 똑같이 반영되어야 할 때는 산술평균을 사용합니다. 어떤 값은 더 크게 반영되어야 할 때는 가중평균을 사용합니다. 데이터가 시간 순서대로 나열되어 있고 단기적인 오르내림을 완화하고 싶다면 이동평균을 사용합니다.
산술평균: 모든 값이 똑같이 반영되어야 할 때 사용
산술평균은 우리가 보통 말하는 평균입니다.
이 방법은 각 관측값이 같은 정도로 영향을 주어야 할 때 잘 맞습니다. 어떤 값이 다른 값보다 더 중요해야 한다면, 산술평균은 적절한 요약값이 아닙니다.
평균은 집합의 모든 값을 사용하므로 유용하고 집단 간 비교도 쉽습니다. 하지만 이상치에 민감해서, 유난히 크거나 작은 값 하나가 평균을 우리가 느끼는 전형적인 수준에서 멀어지게 만들 수 있습니다.
가중평균: 어떤 값이 더 중요할 때 사용
가중평균은 값마다 서로 다른 중요도를 부여합니다.
여기서 는 값이고 는 그 값의 가중치입니다. 가중치가 클수록 그 값이 결과에 더 큰 영향을 줍니다.
문제에서 이미 어떤 부분이 더 중요하다고 알려 줄 때 이 방법이 적절합니다. 과목 성적, 포트폴리오 비중에 따른 투자 수익률, 수량을 반영한 평균 가격이 모두 이런 경우입니다.
중요한 조건이 하나 있습니다. 전체 가중치 는 이 아니어야 합니다. 또한 가중치가 실제로 모델링하려는 상황과 맞아야만 결과에 의미가 있습니다.
이동평균: 시간에 따른 데이터를 부드럽게 볼 때 사용
이동평균은 시간 순서대로 나열된 데이터에 사용합니다. 전체 집합을 한 번에 평균내는 대신, 최근 값들의 일정 구간을 이동시키며 평균을 구합니다.
구간 길이가 인 단순이동평균은 다음과 같습니다.
이 방법은 들쭉날쭉한 데이터를 부드럽게 만들어 단기 추세를 더 보기 쉽게 해 줍니다. 그렇다고 변동 자체를 없애는 것은 아니고, 미래를 예측하는 것도 아닙니다. 단지 선택한 구간을 사용해 최근 데이터를 요약할 뿐입니다.
구간 길이는 매우 중요합니다. 구간을 바꾸면 이동평균도 함께 바뀝니다. 보통 구간이 길수록 반응이 느려져 더 매끄럽게 보입니다.
차이를 보여 주는 하나의 예제
어떤 학생의 5주간 연습 점수가 , , , , 이라고 해 봅시다.
5주 전체에 대한 하나의 종합 평균을 구하고 싶다면 산술평균을 사용합니다.
따라서 산술평균은 입니다.
이제 교사가 최근 과제를 더 크게 반영하고 싶어서 가중치를 로 준다고 해 봅시다. 그러면 가중평균은 다음과 같습니다.
따라서 가중평균은 입니다. 최근 점수가 더 중요하게 반영되므로 결과가 올라갑니다.
반대로 최근 추세를 부드럽게 보고 싶다면, 마지막 3주에 대한 주 이동평균을 사용합니다.
이 값은 전체 과정의 평균을 대신하는 것이 아닙니다. 다른 질문에 답하는 값입니다. 즉, 최근 성과가 어떠했는지를 보여 줍니다.
같은 다섯 개의 수에서 세 가지 서로 다른 평균이 나온 이유는 목표가 달라졌기 때문입니다. 이것이 바로 알맞은 평균을 선택할 때의 핵심입니다.
평균을 다룰 때 자주 하는 실수
데이터에 이미 가중치가 있는데 산술평균을 사용하는 경우
시험 영역, 수량, 백분율의 중요도가 서로 다르다면 단순평균은 오해를 부를 수 있습니다. 모든 값이 똑같이 기여해야 할 때만 동일 가중이 맞습니다.
원래 가중치를 유지하지 않고 평균들의 평균을 내는 경우
한 반에 학생이 명이고 다른 반에 명이 있다면, 보통 두 반의 평균을 같은 크기의 집단처럼 단순히 다시 평균내면 안 됩니다. 원래의 인원수나 가중치가 필요합니다.
전체 가중치로 나누는 것을 잊는 경우
가중평균에서는 값에 가중치를 곱하는 것만으로 끝나지 않습니다. 마지막에 반드시 로 나누어야 합니다.
구간 길이를 말하지 않고 이동평균이라고만 하는 경우
이동평균은 어떤 구간을 썼는지 밝히지 않으면 불완전합니다. 일 이동평균과 일 이동평균은 서로 바꿔 쓸 수 없습니다.
각 평균은 언제 쓰는가
산술평균은 시험 점수, 측정값처럼 모든 관측값이 똑같이 반영되어야 하는 데이터에 사용합니다.
가중평균은 성적 항목 비중이나 판매 수량처럼 문제에서 이미 중요도를 부여한 경우에 사용합니다.
이동평균은 기온, 매출, 교통량, 학습 진도처럼 시간에 따라 기록되고, 시기마다 값의 변동이 큰 데이터에 사용합니다.
비슷한 문제를 직접 해 보기
자신의 공부나 작업 데이터에서 숫자 다섯 개를 골라 보세요. 먼저 산술평균을 구하고, 그다음 마지막 두 값의 가중치를 두 배로 한 가중평균을 구해 보세요. 마지막으로 마지막 구간에 대한 개 값 이동평균도 구해 보세요. 이렇게 간단히 비교해 보면, 자신의 문제에 실제로 어떤 평균이 필요한지 보통 더 분명해집니다.