중앙값은 정렬된 숫자 목록에서 가운데에 있는 값입니다. 중앙값을 구하려면 먼저 숫자를 순서대로 정렬한 다음 가운데를 찾습니다. 값의 개수가 홀수이면 가운데 숫자 하나가 중앙값이고, 짝수이면 가운데 두 숫자의 평균이 중앙값입니다.

모든 경우에 외워야 하는 별도의 중앙값 공식이 있는 것은 아닙니다. 구하는 방법은 값의 개수가 홀수인지 짝수인지에 따라 달라집니다.

odd number of valuesmedian=middle value\text{odd number of values} \Rightarrow \text{median} = \text{middle value} even number of valuesmedian=a+b2\text{even number of values} \Rightarrow \text{median} = \frac{a+b}{2}

여기서 aabb는 정렬된 목록에서 가운데에 있는 두 값입니다.

3단계로 중앙값 구하기

  1. 숫자를 작은 것부터 큰 것까지 순서대로 정렬합니다.
  2. 목록에 값이 몇 개인지 셉니다.
  3. 개수가 홀수이면 가운데 값을 고르고, 짝수이면 가운데 두 값의 평균을 구합니다.

정렬은 학생들이 가장 자주 놓치는 단계입니다. 정렬하지 않으면 "가운데"라는 말은 정확한 의미를 갖지 않습니다.

값의 개수가 짝수일 때의 중앙값 예시

2,4,5,7,50,1002, 4, 5, 7, 50, 100의 중앙값을 구해 봅시다.

숫자들은 이미 순서대로 정렬되어 있습니다. 값은 66개이므로 개수는 짝수입니다. 따라서 중앙값은 가운데 두 값의 평균입니다.

가운데 두 값은 5577이므로,

median=5+72=6\text{median} = \frac{5+7}{2} = 6

따라서 중앙값은 66입니다. 5050100100이 다른 값들보다 훨씬 크더라도, 가운데에 놓이는 두 값이 무엇인지는 바뀌지 않습니다.

중앙값이 중요한 이유

중앙값은 데이터 집합의 중심에 무엇이 있는지를 알려 줍니다. 정렬된 목록에서는 대략 절반의 값이 한쪽에 있고, 나머지 절반이 다른 쪽에 있습니다.

그래서 중앙값은 한두 개의 값이 유난히 크거나 작은 경우에 특히 유용합니다. 이런 극단값은 평균을 크게 끌어당길 수 있지만, 중앙값은 상대적으로 덜 변하는 경우가 많습니다.

이 때문에 사람들은 평균만이 아니라 중위소득, 주택 중간가격, 중앙 응답 시간 같은 값을 자주 사용합니다.

홀수 개 목록과 짝수 개 목록

목록의 값 개수가 홀수이면 정확히 가운데 값이 하나 있습니다. 값 개수가 짝수이면 가운데 항목이 하나로 정해지지 않으므로, 수치형 데이터에서는 가운데 두 값의 평균을 구합니다.

평균을 구하는 규칙은 숫자에 적용된다는 점에 주의하세요. 데이터가 순서만 있는 범주형 자료라면 가운데 위치를 말할 수는 있지만, 가운데 두 항목의 평균을 구하는 것은 의미가 없습니다.

중앙값을 구할 때 자주 하는 실수

  • 먼저 정렬하지 않는 것. 9,2,7,4,59, 2, 7, 4, 5에서 중앙값은 적힌 순서의 세 번째 숫자가 아닙니다. 2,4,5,7,92, 4, 5, 7, 9로 정렬한 뒤 중앙값은 55입니다.
  • 중앙값과 평균을 혼동하는 것. 평균은 모든 값을 사용해 계산하지만, 중앙값은 정렬된 목록에서 가운데 위치만 사용합니다.
  • 짝수 개의 수치형 목록에서 가운데 숫자 하나만 고르는 것. 가운데 두 값과 그 평균이 모두 필요합니다.
  • 중앙값이 반드시 원래 목록에 있어야 한다고 생각하는 것. 3,5,8,93, 5, 8, 9에서 중앙값은 5+82=6.5\frac{5+8}{2} = 6.5이며, 이는 목록에 있는 값이 아닙니다.

중앙값을 언제 사용하나요?

대표적인 가운데 값을 알고 싶고, 데이터에 이상치나 치우침이 있을 수 있다면 중앙값을 사용하세요. 통계, 경제, 그리고 몇 개의 매우 크거나 매우 작은 값이 평균을 왜곡할 수 있는 일상적인 요약에서 흔히 쓰입니다.

비슷한 문제를 풀어 보세요

1,3,4,6,9,20,251, 3, 4, 6, 9, 20, 25의 중앙값을 구한 다음, 1,3,4,6,9,201, 3, 4, 6, 9, 20의 중앙값도 구해 보세요. 바뀐 것은 값의 개수뿐이므로, 가운데를 찾는 단계에서 무엇이 달라지는지에 집중해 보세요. 더 나아가고 싶다면 각 중앙값을 평균과 비교해서 어떤 측정값이 더 많이 움직이는지도 살펴보세요.

문제 풀이가 필요하신가요?

문제를 올리면 검증된 단계별 풀이를 몇 초 만에 받을 수 있습니다.

GPAI Solver 열기 →