Số trung bình là một con số duy nhất dùng để tóm tắt một tập giá trị. Trong trường học, "trung bình" thường có nghĩa là trung bình cộng, nhưng trung bình có trọng số hoặc trung bình trượt đôi khi lại phù hợp hơn vì mỗi loại trả lời một câu hỏi khác nhau.

Dùng trung bình cộng khi mọi giá trị đều nên được tính như nhau. Dùng trung bình có trọng số khi một số giá trị cần được tính quan trọng hơn những giá trị khác. Dùng trung bình trượt khi dữ liệu được sắp theo thời gian và bạn muốn làm mượt những biến động tăng giảm ngắn hạn.

Trung bình cộng: dùng khi mọi giá trị đều nên được tính như nhau

Trung bình cộng là cách tính trung bình thông thường:

mean=x1+x2++xnn\text{mean} = \frac{x_1 + x_2 + \cdots + x_n}{n}

Cách này phù hợp khi mỗi quan sát đều xứng đáng có mức ảnh hưởng như nhau. Nếu một giá trị cần quan trọng hơn giá trị khác, thì trung bình cộng không phải là cách tóm tắt phù hợp.

Trung bình cộng sử dụng mọi giá trị trong tập dữ liệu, nên nó hữu ích và dễ so sánh giữa các nhóm. Nó cũng nhạy với giá trị ngoại lai, vì vậy một số quá lớn hoặc quá nhỏ bất thường có thể kéo kết quả lệch khỏi mức mà ta cảm thấy là điển hình.

Trung bình có trọng số: dùng khi một số giá trị quan trọng hơn

Trung bình có trọng số gán mức độ quan trọng khác nhau cho các giá trị khác nhau:

weighted average=wixiwi\text{weighted average} = \frac{\sum w_i x_i}{\sum w_i}

Ở đây, xix_i là một giá trị và wiw_i là trọng số của nó. Trọng số lớn hơn sẽ khiến một giá trị có ảnh hưởng lớn hơn đến kết quả.

Đây là công cụ phù hợp khi bài toán đã cho biết rằng một số phần quan trọng hơn. Điểm tổng kết môn học, lợi nhuận đầu tư theo tỷ trọng danh mục, và giá trung bình theo số lượng đều theo kiểu này.

Có một điều kiện quan trọng: tổng trọng số wi\sum w_i không được bằng 00. Kết quả chỉ có ý nghĩa nếu các trọng số thực sự phù hợp với tình huống bạn đang mô hình hóa.

Trung bình trượt: dùng để làm mượt dữ liệu theo thời gian

Trung bình trượt được dùng cho dữ liệu được liệt kê theo thứ tự thời gian. Thay vì lấy trung bình của toàn bộ tập dữ liệu cùng lúc, bạn lấy trung bình của một cửa sổ trượt gồm các giá trị gần đây.

Với trung bình trượt đơn giản có độ dài cửa sổ là kk:

MAt=xt+xt1++xtk+1k\text{MA}_t = \frac{x_t + x_{t-1} + \cdots + x_{t-k+1}}{k}

Cách này giúp làm mượt dữ liệu nhiễu để xu hướng ngắn hạn dễ nhìn thấy hơn. Nó không loại bỏ biến động, và cũng không dự đoán tương lai. Nó chỉ tóm tắt dữ liệu gần đây bằng cửa sổ mà bạn đã chọn.

Độ dài cửa sổ rất quan trọng. Thay đổi cửa sổ thì trung bình trượt cũng thay đổi. Cửa sổ dài hơn thường cho đồ thị mượt hơn vì nó phản ứng chậm hơn.

Một ví dụ có lời giải cho thấy sự khác biệt

Giả sử điểm luyện tập của một học sinh trong năm tuần là 7070, 7575, 8080, 8585100100.

Nếu bạn muốn một mức trung bình chung cho cả năm tuần, hãy dùng trung bình cộng:

70+75+80+85+1005=4105=82\frac{70 + 75 + 80 + 85 + 100}{5} = \frac{410}{5} = 82

Vậy trung bình cộng là 8282.

Bây giờ giả sử giáo viên muốn các bài làm gần đây được tính nhiều hơn, với trọng số 1,1,1,2,21, 1, 1, 2, 2. Khi đó trung bình có trọng số là

1(70)+1(75)+1(80)+2(85)+2(100)1+1+1+2+2=5957=85\frac{1(70) + 1(75) + 1(80) + 2(85) + 2(100)}{1 + 1 + 1 + 2 + 2} = \frac{595}{7} = 85

Vậy trung bình có trọng số là 8585. Các điểm mới hơn quan trọng hơn nên kết quả tăng lên.

Nếu thay vào đó bạn muốn làm mượt xu hướng gần đây, hãy dùng trung bình trượt 33 tuần cho ba tuần cuối:

80+85+1003=265388.3\frac{80 + 85 + 100}{3} = \frac{265}{3} \approx 88.3

Kết quả này không thay thế điểm trung bình của cả khóa học. Nó trả lời một câu hỏi khác: kết quả học tập gần đây trông như thế nào?

Cùng năm con số nhưng cho ra ba loại trung bình khác nhau vì mục tiêu đã thay đổi. Đó là ý chính khi chọn đúng loại trung bình.

Những lỗi thường gặp khi làm việc với số trung bình

Dùng trung bình cộng khi dữ liệu đã có trọng số

Nếu các nhóm điểm kiểm tra, số lượng hoặc tỷ lệ phần trăm có mức độ quan trọng khác nhau, thì trung bình cộng thông thường có thể gây hiểu lầm. Việc cho trọng số bằng nhau chỉ hợp lý khi mỗi giá trị nên đóng góp như nhau.

Lấy trung bình của các số trung bình mà không giữ lại trọng số ban đầu

Nếu một lớp có 1010 học sinh và lớp khác có 3030 học sinh, bạn thường không thể lấy trung bình của hai điểm trung bình lớp như thể hai nhóm có quy mô bằng nhau. Bạn cần số lượng hoặc trọng số gốc.

Quên chia cho tổng trọng số

Với trung bình có trọng số, nhân các giá trị với trọng số mới chỉ là một phần của công việc. Bạn vẫn phải chia cho wi\sum w_i.

Gọi tên trung bình trượt mà không nêu độ dài cửa sổ

Một trung bình trượt là chưa đầy đủ nếu bạn không nói rõ đã dùng cửa sổ nào. Trung bình trượt 33 ngày và trung bình trượt 3030 ngày không thể thay thế cho nhau.

Khi nào dùng từng loại trung bình

Dùng trung bình cộng cho điểm kiểm tra, phép đo hoặc các dữ liệu khác mà mọi quan sát đều nên được tính như nhau.

Dùng trung bình có trọng số khi bài toán đã gán mức độ quan trọng, chẳng hạn như các nhóm điểm thành phần hoặc số lượng hàng bán ra.

Dùng trung bình trượt cho dữ liệu theo thời gian như nhiệt độ, doanh số, lưu lượng giao thông hoặc tiến độ học tập khi các giá trị thô dao động mạnh từ giai đoạn này sang giai đoạn khác.

Hãy thử một bài tương tự

Lấy năm con số từ dữ liệu công việc hoặc học tập của chính bạn. Tính trung bình cộng, rồi tính trung bình có trọng số trong đó hai giá trị cuối được tính gấp đôi, sau đó tính trung bình trượt 33 giá trị cho cửa sổ cuối cùng. So sánh nhanh như vậy thường sẽ cho thấy bài toán của bạn thực sự cần loại trung bình nào.

Cần trợ giúp giải bài?

Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.

Mở GPAI Solver →