Trung bình, trung vị và mốt là ba cách để mô tả tâm của một tập dữ liệu. Trung bình là giá trị trung bình cộng, trung vị là giá trị ở giữa sau khi sắp xếp, còn mốt là giá trị xuất hiện nhiều nhất. Nếu bạn muốn một quy tắc nhanh: dùng trung bình khi dữ liệu khá cân đối, dùng trung vị khi các giá trị ngoại lai có thể làm lệch kết quả, và dùng mốt khi giá trị phổ biến nhất là điều quan trọng nhất.
Các thước đo này có thể cho ra những đáp án khác nhau vì chúng định nghĩa "tâm" theo những cách khác nhau. Đó chính là lý do chúng hữu ích.
Trung bình, trung vị và mốt trong nháy mắt
Trung bình sử dụng mọi giá trị trong tập:
Vì mọi giá trị đều góp phần vào kết quả, một số lớn hoặc nhỏ bất thường có thể kéo giá trị trung bình ra xa điều mà ta cảm thấy là điển hình.
Trung vị là giá trị ở giữa khi dữ liệu được liệt kê theo thứ tự. Nếu số lượng giá trị là số lẻ, sẽ có một giá trị ở giữa. Nếu số lượng giá trị là số chẵn, trung vị là trung bình cộng của hai giá trị ở giữa.
Mốt là giá trị xuất hiện nhiều nhất. Một tập dữ liệu có thể có một mốt, nhiều hơn một mốt, hoặc không có mốt nếu không có giá trị nào xuất hiện nhiều hơn các giá trị khác.
Ví dụ có lời giải với một giá trị ngoại lai
Dùng tập dữ liệu .
Trung bình là
Trung vị là vì là giá trị ở giữa trong danh sách đã sắp xếp.
Mốt cũng là vì nó xuất hiện nhiều hơn bất kỳ giá trị nào khác.
Ví dụ này quan trọng vì dữ liệu có một giá trị ngoại lai: . Chỉ một giá trị đó đã kéo trung bình lên , trong khi trung vị vẫn là . Nếu mục tiêu của bạn là mô tả một giá trị điển hình cho tập này, trung vị thường là cách tóm tắt tốt hơn.
Những lỗi thường gặp với trung bình, trung vị và mốt
Không sắp xếp trước khi tìm trung vị
Trung vị phụ thuộc vào thứ tự. Nếu danh sách không được sắp xếp trước, con số ở giữa mà bạn chọn sẽ không đáng tin cậy.
Coi "trung bình" lúc nào cũng có nghĩa là số trung bình cộng
Trong ngôn ngữ hằng ngày, mọi người thường dùng từ "trung bình" khá chung chung. Trong thống kê, bạn nên chính xác hơn. Đôi khi trung vị hoặc mốt mới cho cách tóm tắt hữu ích hơn.
Cho rằng mọi tập dữ liệu đều có mốt
Tập không có mốt vì không giá trị nào lặp lại. Một tập cũng có thể có hai mốt hoặc nhiều mốt nếu nhiều giá trị cùng có tần suất cao nhất.
Bỏ qua các giá trị ngoại lai
Nếu một giá trị lớn hơn hoặc nhỏ hơn hẳn phần còn lại, trung bình có thể thay đổi rất nhiều. Điều đó không có nghĩa là trung bình sai, nhưng nó làm thay đổi câu chuyện mà con số đó kể.
Khi nào nên dùng từng thước đo xu hướng trung tâm
Dùng trung bình khi dữ liệu khá cân đối và mọi giá trị đều nên ảnh hưởng đến kết quả. Điểm kiểm tra từ một bài quiz có độ ổn định là một ví dụ đơn giản.
Dùng trung vị khi các giá trị cực đoan có thể làm méo tâm dữ liệu. Dữ liệu về thu nhập, tiền thuê nhà và giá nhà là những trường hợp phổ biến vì một vài giá trị rất lớn có thể kéo trung bình lên cao.
Dùng mốt khi giá trị xuất hiện nhiều nhất quan trọng hơn tâm số học. Cỡ áo bán ra trong một cửa hàng hoặc câu trả lời khảo sát phổ biến nhất phù hợp với kiểu này.
Vì sao học sinh học khái niệm này
Các thước đo xu hướng trung tâm thường là bước đầu tiên để hiểu dữ liệu. Chúng giúp bạn tóm tắt một danh sách giá trị trước khi so sánh các nhóm, xem độ phân tán, hoặc quyết định liệu dữ liệu có bị lệch hay không.
Nếu dữ liệu là dữ liệu số và khá ổn định, trung bình thường cung cấp nhiều thông tin. Nếu dữ liệu bị lệch, trung vị thường an toàn hơn. Nếu câu hỏi là về điều gì xảy ra thường xuyên nhất, mốt có thể là thước đo duy nhất trả lời trực tiếp.
Thử một bài tương tự
Lấy danh sách và tìm cả ba thước đo. Sau đó thay bằng và so sánh điều gì thay đổi. Chỉ một điều chỉnh đó cũng giúp bạn thấy vai trò của các giá trị ngoại lai rõ hơn nhiều.
Cần trợ giúp giải bài?
Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.
Mở GPAI Solver →