Phân phối tần số là một bảng hoặc biểu đồ cho biết mỗi giá trị, nhóm hoặc khoảng xuất hiện bao nhiêu lần trong một tập dữ liệu. Nếu dữ liệu lớn, các giá trị gần nhau thường được gộp thành các khoảng lớp, và số lượng trong mỗi khoảng chính là tần số.

Nó hữu ích vì dữ liệu thô thường khó quan sát nhanh. Phân phối tần số giúp làm lộ rõ quy luật một cách nhanh chóng: các giá trị tập trung ở đâu, thưa dần ở đâu và kết quả nào xuất hiện nhiều nhất.

Bảng Phân Phối Tần Số So Với Bảng Ghép Nhóm

Với dữ liệu chưa ghép nhóm, bảng có thể liệt kê riêng từng giá trị. Nếu các điểm số là 4,5,5,6,6,64, 5, 5, 6, 6, 6, thì tần số của 6633 vì nó xuất hiện ba lần.

Với các tập dữ liệu số lớn hơn, các giá trị chính xác thường được ghép thành các khoảng như 4040-4949, 5050-59596060-6969. Phiên bản đó được gọi là phân phối tần số ghép nhóm.

Cách Hoạt Động Của Khoảng Lớp

Khoảng lớp là một miền giá trị dùng để gom các giá trị gần nhau vào cùng một nhóm. Trong một bảng ghép nhóm tốt, mỗi quan sát chỉ thuộc đúng một lớp, và các lớp không chồng lấn.

Nếu bạn dùng các khoảng như 1010-1919, 2020-29293030-3939, thì một giá trị như 2424 sẽ chỉ thuộc đúng một lớp. Quy tắc rõ ràng này rất quan trọng. Nếu các giới hạn lớp chồng lấn, bảng sẽ trở nên mơ hồ.

Độ rộng lớp là kích thước của mỗi khoảng. Nếu các lớp là 1010-1919, 2020-29293030-3939, thì độ rộng là không đổi. Điều này quan trọng khi bạn vẽ histogram: chỉ khi độ rộng các lớp bằng nhau thì mới có thể so sánh trực tiếp chiều cao các cột một cách an toàn.

Ví Dụ Có Lời Giải: Đọc Một Bảng Phân Phối Tần Số

Giả sử một giáo viên ghi lại điểm kiểm tra ngắn của 2020 học sinh và ghép chúng thành các khoảng:

Khoảng điểm Tần số
00-99 22
1010-1919 55
2020-2929 88
3030-3939 44
4040-4949 11

Khoảng 2020-2929 có tần số lớn nhất, nên đây là khoảng điểm phổ biến nhất. Điều đó không có nghĩa là mọi học sinh đều đạt cùng một điểm. Nó có nghĩa là có 88 học sinh đạt điểm nằm đâu đó trong khoảng này.

Các tần số cũng cộng lại thành tổng số học sinh:

2+5+8+4+1=202 + 5 + 8 + 4 + 1 = 20

Nếu bạn muốn một tỷ lệ thay vì số đếm, hãy dùng tần số tương đối:

relative frequency=frequencytotal number of observations\text{relative frequency} = \frac{\text{frequency}}{\text{total number of observations}}

Với khoảng 2020-2929, tần số tương đối là:

820=0.4\frac{8}{20} = 0.4

Vậy 40%40\% học sinh đạt điểm từ 2020 đến 2929.

Biểu Đồ Phân Phối Tần Số: Biểu Đồ Cột Hay Histogram?

Phân phối tần số có thể được biểu diễn bằng bảng, biểu đồ cột hoặc histogram. Loại biểu đồ phù hợp phụ thuộc vào kiểu dữ liệu bạn có.

Dùng biểu đồ cột khi bạn đang đếm các nhóm riêng biệt, chẳng hạn như loại trái cây yêu thích hoặc phương tiện di chuyển. Các cột được tách rời vì các nhóm là khác nhau.

Dùng histogram khi bạn đang ghép dữ liệu số thành các khoảng. Các cột chạm nhau vì các khoảng biểu diễn một thang đo liên tục.

Nếu tất cả các khoảng lớp có cùng độ rộng, cột histogram cao hơn sẽ biểu thị tần số lớn hơn. Nếu độ rộng các lớp khác nhau, chỉ nhìn chiều cao có thể gây hiểu sai. Trong trường hợp đó, histogram nên dùng mật độ tần số để diện tích cột, chứ không chỉ chiều cao, biểu diễn tần số.

Những Lỗi Thường Gặp Trong Bảng Phân Phối Tần Số

Nhầm Lẫn Giữa Nhóm Và Khoảng

Biểu đồ cột cho các nhóm và histogram cho dữ liệu số đã ghép nhóm không mang cùng ý nghĩa. Dùng sai loại biểu đồ có thể che khuất cấu trúc của dữ liệu.

Dùng Các Lớp Chồng Lấn

Các khoảng cần có quy tắc rõ ràng. Một cách thiết lập như 00-10101010-2020 là có vấn đề nếu bạn không nói chính xác giá trị 1010 thuộc về đâu.

Quên Rằng Việc Ghép Nhóm Làm Mất Chi Tiết

Phân phối tần số ghép nhóm tóm tắt dữ liệu, nhưng không giữ lại mọi giá trị ban đầu. Khi điểm số được gộp vào các khoảng, bạn sẽ thấy quy luật dễ hơn, nhưng sẽ mất đi một phần độ chính xác.

So Sánh Các Cột Không Bằng Nhau Như Thể Chúng Bằng Nhau

Nếu một khoảng lớp rộng gấp đôi khoảng khác, thì histogram không nên được đọc theo cùng cách như histogram có các lớp bằng nhau. Điều kiện này rất quan trọng: các lớp có cùng độ rộng cho phép so sánh trực tiếp chiều cao; các lớp có độ rộng khác nhau thì không.

Khi Nào Dùng Phân Phối Tần Số

Phân phối tần số rất phổ biến trong thống kê, lớp học, khảo sát, kiểm soát chất lượng và công việc phòng thí nghiệm. Chúng hữu ích nhất khi danh sách dữ liệu thô đủ dài đến mức việc nhìn lướt qua không còn cho thấy quy luật một cách rõ ràng.

Chúng cũng là điểm khởi đầu cho các ý tưởng liên quan như histogram, tần số tích lũy, trung bình của dữ liệu ghép nhóm và các ước lượng về độ phân tán.

Thử Một Bài Tương Tự

Lấy 1515 đến 2020 số từ một bài tập, thí nghiệm hoặc danh sách điểm. Trước tiên hãy lập một bảng tần số chưa ghép nhóm, sau đó ghép lại chính dữ liệu đó thành các khoảng lớp. So sánh hai phiên bản là một trong những cách nhanh nhất để thấy phân phối tần số giúp bạn nhận ra điều gì và việc ghép nhóm che đi chi tiết nào.

Cần trợ giúp giải bài?

Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.

Mở GPAI Solver →