การแจกแจงความถี่คือตารางหรือกราฟที่แสดงว่าค่า หมวดหมู่ หรือช่วงใดปรากฏบ่อยแค่ไหนในชุดข้อมูล หากข้อมูลมีจำนวนมาก ค่าที่อยู่ใกล้กันมักถูกรวมเป็นอันตรภาคชั้น และจำนวนข้อมูลในแต่ละช่วงก็คือความถี่
สิ่งนี้มีประโยชน์เพราะข้อมูลดิบมักดูยากเมื่อกวาดสายตา การแจกแจงความถี่ช่วยให้เห็นรูปแบบได้เร็วขึ้นว่า ค่ากระจุกอยู่ตรงไหน เบาบางลงตรงไหน และผลลัพธ์ใดพบได้บ่อยที่สุด
ตารางแจกแจงความถี่ กับ ตารางแจกแจงความถี่แบบจัดกลุ่ม
สำหรับข้อมูลที่ไม่จัดกลุ่ม ตารางสามารถแสดงแต่ละค่าแยกกันได้ ถ้าคะแนนคือ ความถี่ของ คือ เพราะปรากฏสามครั้ง
สำหรับชุดข้อมูลเชิงตัวเลขที่มีขนาดใหญ่ ค่าที่แน่นอนมักถูกรวมเป็นช่วง เช่น -, - และ - รูปแบบนี้เรียกว่า การแจกแจงความถี่แบบจัดกลุ่ม
อันตรภาคชั้นทำงานอย่างไร
อันตรภาคชั้นคือช่วงที่ใช้รวบรวมค่าที่อยู่ใกล้กันให้อยู่ในกลุ่มเดียว ในตารางแบบจัดกลุ่มที่ดี ข้อมูลทุกตัวต้องอยู่ได้พอดีในชั้นเดียว และแต่ละชั้นต้องไม่ทับซ้อนกัน
ถ้าคุณใช้ช่วงอย่าง -, - และ - ค่าอย่าง จะอยู่ได้ในชั้นเดียวอย่างชัดเจน กฎที่ชัดเจนนี้สำคัญมาก ถ้าขอบเขตของชั้นทับซ้อนกัน ตารางจะกำกวม
ความกว้างชั้นคือขนาดของแต่ละช่วง ถ้าชั้นคือ -, - และ - ความกว้างจะคงที่ เรื่องนี้สำคัญเมื่อคุณวาดฮิสโตแกรม เพราะการเปรียบเทียบความสูงของแท่งโดยตรงทำได้อย่างปลอดภัยก็ต่อเมื่อความกว้างของชั้นเท่ากัน
ตัวอย่าง: การอ่านการแจกแจงความถี่
สมมติว่าครูบันทึกคะแนนควิซของนักเรียน คน และจัดกลุ่มเป็นช่วงดังนี้:
| ช่วงคะแนน | ความถี่ |
|---|---|
| - | |
| - | |
| - | |
| - | |
| - |
ช่วง - มีความถี่สูงที่สุด จึงเป็นช่วงคะแนนที่พบมากที่สุด แต่นี่ไม่ได้หมายความว่านักเรียนทุกคนได้คะแนนเท่ากัน หมายความว่า มีนักเรียน คนที่ได้คะแนนอยู่ภายในช่วงนั้น
ความถี่ยังรวมกันได้เท่ากับจำนวนนักเรียนทั้งหมด:
ถ้าคุณต้องการสัดส่วนแทนจำนวน ให้ใช้ความถี่สัมพัทธ์:
สำหรับช่วง - ความถี่สัมพัทธ์คือ:
ดังนั้น ของนักเรียนได้คะแนนระหว่าง ถึง
กราฟการแจกแจงความถี่: กราฟแท่ง หรือ ฮิสโตแกรม?
การแจกแจงความถี่สามารถแสดงได้ด้วยตาราง กราฟแท่ง หรือฮิสโตแกรม กราฟที่เหมาะสมขึ้นอยู่กับชนิดของข้อมูลที่คุณมี
ใช้กราฟแท่งเมื่อคุณกำลังนับหมวดหมู่ที่แยกจากกัน เช่น ผลไม้ที่ชอบหรือประเภทของการเดินทาง แท่งกราฟจะแยกออกจากกันเพราะหมวดหมู่เหล่านี้แตกต่างกันชัดเจน
ใช้ฮิสโตแกรมเมื่อคุณกำลังจัดกลุ่มข้อมูลเชิงตัวเลขเป็นช่วง แท่งจะติดกันเพราะช่วงเหล่านี้แทนสเกลที่ต่อเนื่อง
ถ้าอันตรภาคชั้นทั้งหมดมีความกว้างเท่ากัน แท่งฮิสโตแกรมที่สูงกว่าจะหมายถึงความถี่ที่มากกว่า ถ้าความกว้างของชั้นต่างกัน การดูเฉพาะความสูงอาจทำให้เข้าใจผิดได้ ในกรณีนั้น ฮิสโตแกรมควรใช้ความหนาแน่นความถี่ เพื่อให้พื้นที่ของแท่ง ไม่ใช่แค่ความสูง เป็นตัวแทนของความถี่
ข้อผิดพลาดที่พบบ่อยในตารางแจกแจงความถี่
สับสนระหว่างหมวดหมู่กับช่วง
กราฟแท่งสำหรับหมวดหมู่ และฮิสโตแกรมสำหรับข้อมูลเชิงตัวเลขแบบจัดกลุ่ม ไม่ได้สื่อความหมายเหมือนกัน การใช้กราฟผิดประเภทอาจทำให้โครงสร้างของข้อมูลถูกซ่อนไว้
ใช้ชั้นที่ทับซ้อนกัน
ช่วงต้องมีกฎที่ชัดเจน รูปแบบอย่าง - และ - มีปัญหา เว้นแต่คุณจะระบุให้ชัดว่าค่า อยู่ในช่วงใด
ลืมว่าการจัดกลุ่มทำให้รายละเอียดหายไป
การแจกแจงความถี่แบบจัดกลุ่มช่วยสรุปข้อมูล แต่ไม่ได้เก็บค่าดั้งเดิมทุกค่าไว้ครบ เมื่อคะแนนถูกรวมเป็นช่วง คุณจะเห็นรูปแบบได้ง่ายขึ้น แต่ก็สูญเสียความละเอียดบางส่วนไป
เปรียบเทียบแท่งที่ไม่เท่ากันราวกับว่าเท่ากัน
ถ้าอันตรภาคชั้นหนึ่งกว้างเป็นสองเท่าของอีกชั้นหนึ่ง ฮิสโตแกรมก็ไม่ควรถูกอ่านแบบเดียวกับฮิสโตแกรมที่ทุกชั้นกว้างเท่ากัน เงื่อนไขนี้สำคัญ: ชั้นที่กว้างเท่ากันรองรับการเปรียบเทียบความสูงโดยตรง แต่ชั้นที่กว้างไม่เท่ากันไม่รองรับ
การแจกแจงความถี่ใช้เมื่อใด
การแจกแจงความถี่พบได้บ่อยในวิชาสถิติ ห้องเรียน แบบสำรวจ การควบคุมคุณภาพ และงานในห้องปฏิบัติการ จะมีประโยชน์มากที่สุดเมื่อรายการข้อมูลดิบยาวพอจนการกวาดตาอย่างรวดเร็วไม่สามารถทำให้เห็นรูปแบบได้ชัดเจนอีกต่อไป
นอกจากนี้ยังเป็นจุดเริ่มต้นของแนวคิดที่เกี่ยวข้อง เช่น ฮิสโตแกรม ความถี่สะสม ค่าเฉลี่ยแบบจัดกลุ่ม และการประมาณการกระจายของข้อมูล
ลองทำโจทย์ที่คล้ายกัน
เลือกตัวเลข ถึง ค่า จากแบบฝึกหัด การทดลอง หรือรายการคะแนน ขั้นแรกสร้างตารางแจกแจงความถี่แบบไม่จัดกลุ่ม จากนั้นจัดข้อมูลชุดเดิมใหม่เป็นอันตรภาคชั้น การเปรียบเทียบทั้งสองแบบเป็นวิธีที่เร็วมากในการเห็นว่า การแจกแจงความถี่ช่วยให้คุณสังเกตอะไรได้ และรายละเอียดใดที่การจัดกลุ่มซ่อนไว้
ต้องการความช่วยเหลือในการแก้โจทย์?
อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที
เปิด GPAI Solver →