Trung bình, trung vị và mốt là ba cách để mô tả tâm của một tập dữ liệu. Trung bình là giá trị trung bình cộng, trung vị là giá trị ở giữa sau khi sắp xếp, còn mốt là giá trị xuất hiện nhiều nhất. Nếu bạn muốn một quy tắc nhanh: dùng trung bình khi dữ liệu khá cân đối, dùng trung vị khi các giá trị ngoại lai có thể làm lệch kết quả, và dùng mốt khi giá trị phổ biến nhất là điều quan trọng nhất.

Các thước đo này có thể cho ra những đáp án khác nhau vì chúng định nghĩa "tâm" theo những cách khác nhau. Đó chính là lý do chúng hữu ích.

Trung bình, trung vị và mốt trong nháy mắt

Trung bình sử dụng mọi giá trị trong tập:

mean=sum of all valuesnumber of values\text{mean} = \frac{\text{sum of all values}}{\text{number of values}}

Vì mọi giá trị đều góp phần vào kết quả, một số lớn hoặc nhỏ bất thường có thể kéo giá trị trung bình ra xa điều mà ta cảm thấy là điển hình.

Trung vị là giá trị ở giữa khi dữ liệu được liệt kê theo thứ tự. Nếu số lượng giá trị là số lẻ, sẽ có một giá trị ở giữa. Nếu số lượng giá trị là số chẵn, trung vị là trung bình cộng của hai giá trị ở giữa.

Mốt là giá trị xuất hiện nhiều nhất. Một tập dữ liệu có thể có một mốt, nhiều hơn một mốt, hoặc không có mốt nếu không có giá trị nào xuất hiện nhiều hơn các giá trị khác.

Ví dụ có lời giải với một giá trị ngoại lai

Dùng tập dữ liệu 2,3,3,4,202, 3, 3, 4, 20.

Trung bình là

2+3+3+4+205=325=6.4\frac{2 + 3 + 3 + 4 + 20}{5} = \frac{32}{5} = 6.4

Trung vị là 3333 là giá trị ở giữa trong danh sách đã sắp xếp.

Mốt cũng là 33 vì nó xuất hiện nhiều hơn bất kỳ giá trị nào khác.

Ví dụ này quan trọng vì dữ liệu có một giá trị ngoại lai: 2020. Chỉ một giá trị đó đã kéo trung bình lên 6.46.4, trong khi trung vị vẫn là 33. Nếu mục tiêu của bạn là mô tả một giá trị điển hình cho tập này, trung vị thường là cách tóm tắt tốt hơn.

Những lỗi thường gặp với trung bình, trung vị và mốt

Không sắp xếp trước khi tìm trung vị

Trung vị phụ thuộc vào thứ tự. Nếu danh sách không được sắp xếp trước, con số ở giữa mà bạn chọn sẽ không đáng tin cậy.

Coi "trung bình" lúc nào cũng có nghĩa là số trung bình cộng

Trong ngôn ngữ hằng ngày, mọi người thường dùng từ "trung bình" khá chung chung. Trong thống kê, bạn nên chính xác hơn. Đôi khi trung vị hoặc mốt mới cho cách tóm tắt hữu ích hơn.

Cho rằng mọi tập dữ liệu đều có mốt

Tập 1,2,3,41, 2, 3, 4 không có mốt vì không giá trị nào lặp lại. Một tập cũng có thể có hai mốt hoặc nhiều mốt nếu nhiều giá trị cùng có tần suất cao nhất.

Bỏ qua các giá trị ngoại lai

Nếu một giá trị lớn hơn hoặc nhỏ hơn hẳn phần còn lại, trung bình có thể thay đổi rất nhiều. Điều đó không có nghĩa là trung bình sai, nhưng nó làm thay đổi câu chuyện mà con số đó kể.

Khi nào nên dùng từng thước đo xu hướng trung tâm

Dùng trung bình khi dữ liệu khá cân đối và mọi giá trị đều nên ảnh hưởng đến kết quả. Điểm kiểm tra từ một bài quiz có độ ổn định là một ví dụ đơn giản.

Dùng trung vị khi các giá trị cực đoan có thể làm méo tâm dữ liệu. Dữ liệu về thu nhập, tiền thuê nhà và giá nhà là những trường hợp phổ biến vì một vài giá trị rất lớn có thể kéo trung bình lên cao.

Dùng mốt khi giá trị xuất hiện nhiều nhất quan trọng hơn tâm số học. Cỡ áo bán ra trong một cửa hàng hoặc câu trả lời khảo sát phổ biến nhất phù hợp với kiểu này.

Vì sao học sinh học khái niệm này

Các thước đo xu hướng trung tâm thường là bước đầu tiên để hiểu dữ liệu. Chúng giúp bạn tóm tắt một danh sách giá trị trước khi so sánh các nhóm, xem độ phân tán, hoặc quyết định liệu dữ liệu có bị lệch hay không.

Nếu dữ liệu là dữ liệu số và khá ổn định, trung bình thường cung cấp nhiều thông tin. Nếu dữ liệu bị lệch, trung vị thường an toàn hơn. Nếu câu hỏi là về điều gì xảy ra thường xuyên nhất, mốt có thể là thước đo duy nhất trả lời trực tiếp.

Thử một bài tương tự

Lấy danh sách 5,6,6,7,305, 6, 6, 7, 30 và tìm cả ba thước đo. Sau đó thay 3030 bằng 88 và so sánh điều gì thay đổi. Chỉ một điều chỉnh đó cũng giúp bạn thấy vai trò của các giá trị ngoại lai rõ hơn nhiều.

Cần trợ giúp giải bài?

Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.

Mở GPAI Solver →