การแจกแจงความถี่คือตารางหรือกราฟที่แสดงว่าค่า หมวดหมู่ หรือช่วงใดปรากฏบ่อยแค่ไหนในชุดข้อมูล หากข้อมูลมีจำนวนมาก ค่าที่อยู่ใกล้กันมักถูกรวมเป็นอันตรภาคชั้น และจำนวนข้อมูลในแต่ละช่วงก็คือความถี่

สิ่งนี้มีประโยชน์เพราะข้อมูลดิบมักดูยากเมื่อกวาดสายตา การแจกแจงความถี่ช่วยให้เห็นรูปแบบได้เร็วขึ้นว่า ค่ากระจุกอยู่ตรงไหน เบาบางลงตรงไหน และผลลัพธ์ใดพบได้บ่อยที่สุด

ตารางแจกแจงความถี่ กับ ตารางแจกแจงความถี่แบบจัดกลุ่ม

สำหรับข้อมูลที่ไม่จัดกลุ่ม ตารางสามารถแสดงแต่ละค่าแยกกันได้ ถ้าคะแนนคือ 4,5,5,6,6,64, 5, 5, 6, 6, 6 ความถี่ของ 66 คือ 33 เพราะปรากฏสามครั้ง

สำหรับชุดข้อมูลเชิงตัวเลขที่มีขนาดใหญ่ ค่าที่แน่นอนมักถูกรวมเป็นช่วง เช่น 4040-4949, 5050-5959 และ 6060-6969 รูปแบบนี้เรียกว่า การแจกแจงความถี่แบบจัดกลุ่ม

อันตรภาคชั้นทำงานอย่างไร

อันตรภาคชั้นคือช่วงที่ใช้รวบรวมค่าที่อยู่ใกล้กันให้อยู่ในกลุ่มเดียว ในตารางแบบจัดกลุ่มที่ดี ข้อมูลทุกตัวต้องอยู่ได้พอดีในชั้นเดียว และแต่ละชั้นต้องไม่ทับซ้อนกัน

ถ้าคุณใช้ช่วงอย่าง 1010-1919, 2020-2929 และ 3030-3939 ค่าอย่าง 2424 จะอยู่ได้ในชั้นเดียวอย่างชัดเจน กฎที่ชัดเจนนี้สำคัญมาก ถ้าขอบเขตของชั้นทับซ้อนกัน ตารางจะกำกวม

ความกว้างชั้นคือขนาดของแต่ละช่วง ถ้าชั้นคือ 1010-1919, 2020-2929 และ 3030-3939 ความกว้างจะคงที่ เรื่องนี้สำคัญเมื่อคุณวาดฮิสโตแกรม เพราะการเปรียบเทียบความสูงของแท่งโดยตรงทำได้อย่างปลอดภัยก็ต่อเมื่อความกว้างของชั้นเท่ากัน

ตัวอย่าง: การอ่านการแจกแจงความถี่

สมมติว่าครูบันทึกคะแนนควิซของนักเรียน 2020 คน และจัดกลุ่มเป็นช่วงดังนี้:

ช่วงคะแนน ความถี่
00-99 22
1010-1919 55
2020-2929 88
3030-3939 44
4040-4949 11

ช่วง 2020-2929 มีความถี่สูงที่สุด จึงเป็นช่วงคะแนนที่พบมากที่สุด แต่นี่ไม่ได้หมายความว่านักเรียนทุกคนได้คะแนนเท่ากัน หมายความว่า มีนักเรียน 88 คนที่ได้คะแนนอยู่ภายในช่วงนั้น

ความถี่ยังรวมกันได้เท่ากับจำนวนนักเรียนทั้งหมด:

2+5+8+4+1=202 + 5 + 8 + 4 + 1 = 20

ถ้าคุณต้องการสัดส่วนแทนจำนวน ให้ใช้ความถี่สัมพัทธ์:

relative frequency=frequencytotal number of observations\text{relative frequency} = \frac{\text{frequency}}{\text{total number of observations}}

สำหรับช่วง 2020-2929 ความถี่สัมพัทธ์คือ:

820=0.4\frac{8}{20} = 0.4

ดังนั้น 40%40\% ของนักเรียนได้คะแนนระหว่าง 2020 ถึง 2929

กราฟการแจกแจงความถี่: กราฟแท่ง หรือ ฮิสโตแกรม?

การแจกแจงความถี่สามารถแสดงได้ด้วยตาราง กราฟแท่ง หรือฮิสโตแกรม กราฟที่เหมาะสมขึ้นอยู่กับชนิดของข้อมูลที่คุณมี

ใช้กราฟแท่งเมื่อคุณกำลังนับหมวดหมู่ที่แยกจากกัน เช่น ผลไม้ที่ชอบหรือประเภทของการเดินทาง แท่งกราฟจะแยกออกจากกันเพราะหมวดหมู่เหล่านี้แตกต่างกันชัดเจน

ใช้ฮิสโตแกรมเมื่อคุณกำลังจัดกลุ่มข้อมูลเชิงตัวเลขเป็นช่วง แท่งจะติดกันเพราะช่วงเหล่านี้แทนสเกลที่ต่อเนื่อง

ถ้าอันตรภาคชั้นทั้งหมดมีความกว้างเท่ากัน แท่งฮิสโตแกรมที่สูงกว่าจะหมายถึงความถี่ที่มากกว่า ถ้าความกว้างของชั้นต่างกัน การดูเฉพาะความสูงอาจทำให้เข้าใจผิดได้ ในกรณีนั้น ฮิสโตแกรมควรใช้ความหนาแน่นความถี่ เพื่อให้พื้นที่ของแท่ง ไม่ใช่แค่ความสูง เป็นตัวแทนของความถี่

ข้อผิดพลาดที่พบบ่อยในตารางแจกแจงความถี่

สับสนระหว่างหมวดหมู่กับช่วง

กราฟแท่งสำหรับหมวดหมู่ และฮิสโตแกรมสำหรับข้อมูลเชิงตัวเลขแบบจัดกลุ่ม ไม่ได้สื่อความหมายเหมือนกัน การใช้กราฟผิดประเภทอาจทำให้โครงสร้างของข้อมูลถูกซ่อนไว้

ใช้ชั้นที่ทับซ้อนกัน

ช่วงต้องมีกฎที่ชัดเจน รูปแบบอย่าง 00-1010 และ 1010-2020 มีปัญหา เว้นแต่คุณจะระบุให้ชัดว่าค่า 1010 อยู่ในช่วงใด

ลืมว่าการจัดกลุ่มทำให้รายละเอียดหายไป

การแจกแจงความถี่แบบจัดกลุ่มช่วยสรุปข้อมูล แต่ไม่ได้เก็บค่าดั้งเดิมทุกค่าไว้ครบ เมื่อคะแนนถูกรวมเป็นช่วง คุณจะเห็นรูปแบบได้ง่ายขึ้น แต่ก็สูญเสียความละเอียดบางส่วนไป

เปรียบเทียบแท่งที่ไม่เท่ากันราวกับว่าเท่ากัน

ถ้าอันตรภาคชั้นหนึ่งกว้างเป็นสองเท่าของอีกชั้นหนึ่ง ฮิสโตแกรมก็ไม่ควรถูกอ่านแบบเดียวกับฮิสโตแกรมที่ทุกชั้นกว้างเท่ากัน เงื่อนไขนี้สำคัญ: ชั้นที่กว้างเท่ากันรองรับการเปรียบเทียบความสูงโดยตรง แต่ชั้นที่กว้างไม่เท่ากันไม่รองรับ

การแจกแจงความถี่ใช้เมื่อใด

การแจกแจงความถี่พบได้บ่อยในวิชาสถิติ ห้องเรียน แบบสำรวจ การควบคุมคุณภาพ และงานในห้องปฏิบัติการ จะมีประโยชน์มากที่สุดเมื่อรายการข้อมูลดิบยาวพอจนการกวาดตาอย่างรวดเร็วไม่สามารถทำให้เห็นรูปแบบได้ชัดเจนอีกต่อไป

นอกจากนี้ยังเป็นจุดเริ่มต้นของแนวคิดที่เกี่ยวข้อง เช่น ฮิสโตแกรม ความถี่สะสม ค่าเฉลี่ยแบบจัดกลุ่ม และการประมาณการกระจายของข้อมูล

ลองทำโจทย์ที่คล้ายกัน

เลือกตัวเลข 1515 ถึง 2020 ค่า จากแบบฝึกหัด การทดลอง หรือรายการคะแนน ขั้นแรกสร้างตารางแจกแจงความถี่แบบไม่จัดกลุ่ม จากนั้นจัดข้อมูลชุดเดิมใหม่เป็นอันตรภาคชั้น การเปรียบเทียบทั้งสองแบบเป็นวิธีที่เร็วมากในการเห็นว่า การแจกแจงความถี่ช่วยให้คุณสังเกตอะไรได้ และรายละเอียดใดที่การจัดกลุ่มซ่อนไว้

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →