Phân phối tần số là một bảng hoặc biểu đồ cho biết mỗi giá trị, nhóm hoặc khoảng xuất hiện bao nhiêu lần trong một tập dữ liệu. Nếu dữ liệu lớn, các giá trị gần nhau thường được gộp thành các khoảng lớp, và số lượng trong mỗi khoảng chính là tần số.
Nó hữu ích vì dữ liệu thô thường khó quan sát nhanh. Phân phối tần số giúp làm lộ rõ quy luật một cách nhanh chóng: các giá trị tập trung ở đâu, thưa dần ở đâu và kết quả nào xuất hiện nhiều nhất.
Bảng Phân Phối Tần Số So Với Bảng Ghép Nhóm
Với dữ liệu chưa ghép nhóm, bảng có thể liệt kê riêng từng giá trị. Nếu các điểm số là , thì tần số của là vì nó xuất hiện ba lần.
Với các tập dữ liệu số lớn hơn, các giá trị chính xác thường được ghép thành các khoảng như -, - và -. Phiên bản đó được gọi là phân phối tần số ghép nhóm.
Cách Hoạt Động Của Khoảng Lớp
Khoảng lớp là một miền giá trị dùng để gom các giá trị gần nhau vào cùng một nhóm. Trong một bảng ghép nhóm tốt, mỗi quan sát chỉ thuộc đúng một lớp, và các lớp không chồng lấn.
Nếu bạn dùng các khoảng như -, - và -, thì một giá trị như sẽ chỉ thuộc đúng một lớp. Quy tắc rõ ràng này rất quan trọng. Nếu các giới hạn lớp chồng lấn, bảng sẽ trở nên mơ hồ.
Độ rộng lớp là kích thước của mỗi khoảng. Nếu các lớp là -, - và -, thì độ rộng là không đổi. Điều này quan trọng khi bạn vẽ histogram: chỉ khi độ rộng các lớp bằng nhau thì mới có thể so sánh trực tiếp chiều cao các cột một cách an toàn.
Ví Dụ Có Lời Giải: Đọc Một Bảng Phân Phối Tần Số
Giả sử một giáo viên ghi lại điểm kiểm tra ngắn của học sinh và ghép chúng thành các khoảng:
| Khoảng điểm | Tần số |
|---|---|
| - | |
| - | |
| - | |
| - | |
| - |
Khoảng - có tần số lớn nhất, nên đây là khoảng điểm phổ biến nhất. Điều đó không có nghĩa là mọi học sinh đều đạt cùng một điểm. Nó có nghĩa là có học sinh đạt điểm nằm đâu đó trong khoảng này.
Các tần số cũng cộng lại thành tổng số học sinh:
Nếu bạn muốn một tỷ lệ thay vì số đếm, hãy dùng tần số tương đối:
Với khoảng -, tần số tương đối là:
Vậy học sinh đạt điểm từ đến .
Biểu Đồ Phân Phối Tần Số: Biểu Đồ Cột Hay Histogram?
Phân phối tần số có thể được biểu diễn bằng bảng, biểu đồ cột hoặc histogram. Loại biểu đồ phù hợp phụ thuộc vào kiểu dữ liệu bạn có.
Dùng biểu đồ cột khi bạn đang đếm các nhóm riêng biệt, chẳng hạn như loại trái cây yêu thích hoặc phương tiện di chuyển. Các cột được tách rời vì các nhóm là khác nhau.
Dùng histogram khi bạn đang ghép dữ liệu số thành các khoảng. Các cột chạm nhau vì các khoảng biểu diễn một thang đo liên tục.
Nếu tất cả các khoảng lớp có cùng độ rộng, cột histogram cao hơn sẽ biểu thị tần số lớn hơn. Nếu độ rộng các lớp khác nhau, chỉ nhìn chiều cao có thể gây hiểu sai. Trong trường hợp đó, histogram nên dùng mật độ tần số để diện tích cột, chứ không chỉ chiều cao, biểu diễn tần số.
Những Lỗi Thường Gặp Trong Bảng Phân Phối Tần Số
Nhầm Lẫn Giữa Nhóm Và Khoảng
Biểu đồ cột cho các nhóm và histogram cho dữ liệu số đã ghép nhóm không mang cùng ý nghĩa. Dùng sai loại biểu đồ có thể che khuất cấu trúc của dữ liệu.
Dùng Các Lớp Chồng Lấn
Các khoảng cần có quy tắc rõ ràng. Một cách thiết lập như - và - là có vấn đề nếu bạn không nói chính xác giá trị thuộc về đâu.
Quên Rằng Việc Ghép Nhóm Làm Mất Chi Tiết
Phân phối tần số ghép nhóm tóm tắt dữ liệu, nhưng không giữ lại mọi giá trị ban đầu. Khi điểm số được gộp vào các khoảng, bạn sẽ thấy quy luật dễ hơn, nhưng sẽ mất đi một phần độ chính xác.
So Sánh Các Cột Không Bằng Nhau Như Thể Chúng Bằng Nhau
Nếu một khoảng lớp rộng gấp đôi khoảng khác, thì histogram không nên được đọc theo cùng cách như histogram có các lớp bằng nhau. Điều kiện này rất quan trọng: các lớp có cùng độ rộng cho phép so sánh trực tiếp chiều cao; các lớp có độ rộng khác nhau thì không.
Khi Nào Dùng Phân Phối Tần Số
Phân phối tần số rất phổ biến trong thống kê, lớp học, khảo sát, kiểm soát chất lượng và công việc phòng thí nghiệm. Chúng hữu ích nhất khi danh sách dữ liệu thô đủ dài đến mức việc nhìn lướt qua không còn cho thấy quy luật một cách rõ ràng.
Chúng cũng là điểm khởi đầu cho các ý tưởng liên quan như histogram, tần số tích lũy, trung bình của dữ liệu ghép nhóm và các ước lượng về độ phân tán.
Thử Một Bài Tương Tự
Lấy đến số từ một bài tập, thí nghiệm hoặc danh sách điểm. Trước tiên hãy lập một bảng tần số chưa ghép nhóm, sau đó ghép lại chính dữ liệu đó thành các khoảng lớp. So sánh hai phiên bản là một trong những cách nhanh nhất để thấy phân phối tần số giúp bạn nhận ra điều gì và việc ghép nhóm che đi chi tiết nào.
Cần trợ giúp giải bài?
Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.
Mở GPAI Solver →