ฮิสโตแกรมแสดงว่าค่าตัวเลขตกอยู่ในช่วงต่าง ๆ บ่อยแค่ไหน เช่น 00 ถึง 1010 หรือ 1010 ถึง 2020 ความกว้างชั้นคือขนาดของแต่ละช่วง และความถี่คือจำนวนค่าที่อยู่ในช่วงนั้น

ถ้าจะอ่านให้เร็ว ให้ดูป้ายกำกับช่วงบนแกนนอน หาว่าแท่งไหนสูงที่สุด และสังเกตว่าตรงไหนแท่งเริ่มเตี้ยลงหรือหายไป วิธีนี้ช่วยให้เห็นว่าข้อมูลกระจุกอยู่ตรงไหน และตรงไหนมีข้อมูลน้อย

ฮิสโตแกรมบอกอะไรได้บ้าง

ฮิสโตแกรมใช้กับข้อมูลเชิงตัวเลขที่ถูกจัดเป็นช่วง ซึ่งมักเรียกว่า classes หรือ bins แท่งจะติดกันเพราะช่วงต่าง ๆ อยู่ต่อเนื่องกันบนเส้นจำนวน

นี่จึงเป็นเหตุผลว่าทำไมฮิสโตแกรมจึงไม่เหมือนกราฟแท่ง กราฟแท่งใช้เปรียบเทียบหมวดหมู่ที่แยกจากกัน เช่น กีฬา หรือ สี ส่วนฮิสโตแกรมใช้แสดงรูปร่างของการแจกแจงข้อมูล

ความถี่และความกว้างชั้น

ความถี่ ของชั้นคือจำนวนข้อมูลที่อยู่ในช่วงนั้น ถ้าช่วง 6060 ถึง 7070 มีคะแนนสอบ 88 ค่า ความถี่ของช่วงนั้นคือ 88

ความกว้างชั้น คือขนาดของช่วง สำหรับช่วง 6060 ถึง 7070 ความกว้างชั้นคือ 1010 เมื่อทุกชั้นมีความกว้างเท่ากัน แท่งที่สูงกว่าจะหมายถึงความถี่ที่มากกว่า

ถ้าความกว้างชั้นไม่เท่ากัน อย่าเปรียบเทียบความสูงของแท่งทันที ในหลายวิชา แกนตั้งจะเปลี่ยนเป็น ความหนาแน่นความถี่ เพื่อให้พื้นที่ของแท่งแทนความถี่ แทนที่จะดูจากความสูงอย่างเดียว

frequency density=frequencyclass width\text{frequency density} = \frac{\text{frequency}}{\text{class width}}

ดังนั้นก่อนเปรียบเทียบแท่ง ให้ตรวจว่าชั้นต่าง ๆ มีความกว้างเท่ากันหรือไม่ และดูด้วยว่าแกนตั้งวัดอะไร

ตัวอย่างฮิสโตแกรมที่มีความกว้างชั้นเท่ากัน

สมมติว่าฮิสโตแกรมสรุปคะแนนควิซดังนี้

ช่วงคะแนน ความถี่
4040 ถึง 5050 22
5050 ถึง 6060 55
6060 ถึง 7070 88
7070 ถึง 8080 44
8080 ถึง 9090 11

แต่ละชั้นมีความกว้าง 1010 ดังนั้นจึงเปรียบเทียบความสูงของแท่งได้โดยตรง

แท่งที่สูงที่สุดคือช่วง 6060 ถึง 7070 ดังนั้นช่วงนี้มีคะแนนมากที่สุด คะแนนส่วนใหญ่อยู่ระหว่าง 5050 ถึง 8080 และมีเพียงไม่กี่คะแนนที่ต่ำกว่า 5050 หรือสูงกว่า 8080

สรุปแบบชัดเจนได้ว่า คะแนนกระจุกอยู่ตรงกลาง โดยมีการกระจุกมากที่สุดในช่วง 6060 ถึง 7070

วิธีอ่านฮิสโตแกรมทีละขั้น

เริ่มจากแกนนอนก่อน เพื่อให้รู้ว่าแต่ละแท่งครอบคลุมช่วงใด จากนั้นตรวจว่าความกว้างชั้นเท่ากันหรือไม่

ถ้าความกว้างเท่ากัน แท่งที่สูงที่สุดจะแสดงช่วงที่พบข้อมูลบ่อยที่สุด หลังจากนั้นให้มองภาพรวมของรูปทรง: จุดศูนย์กลางอยู่ตรงไหน มีช่องว่างตรงไหน และด้านใดยาวออกไปมากกว่าอีกด้านหรือไม่

ถ้าความกว้างไม่เท่ากัน ให้หยุดก่อนที่จะเปรียบเทียบความสูง คุณต้องรู้ก่อนว่ากราฟใช้ความถี่หรือความหนาแน่นความถี่

ข้อผิดพลาดที่พบบ่อย

สับสนระหว่างฮิสโตแกรมกับกราฟแท่ง

ในฮิสโตแกรม แท่งมักจะติดกันเพราะช่วงข้อมูลต่อเนื่องกัน ส่วนในกราฟแท่ง หมวดหมู่แยกจากกัน ดังนั้นการมีช่องว่างระหว่างแท่งจึงเป็นเรื่องปกติ

มองข้ามความกว้างชั้น

นักเรียนมักเปรียบเทียบความสูงของแท่งโดยไม่ตรวจว่าทุกช่วงมีความกว้างเท่ากันหรือไม่ วิธีนี้ใช้ได้ก็ต่อเมื่อความกว้างชั้นเท่ากัน หรือเมื่อแกนตั้งถูกปรับเป็นความหนาแน่นความถี่แล้ว

มองปลายช่วงอย่างไม่ระวัง

ข้อมูลแบบจัดกลุ่มต้องมีกฎที่สม่ำเสมอเกี่ยวกับขอบเขตของช่วง ตัวอย่างเช่น คะแนน 7070 ควรอยู่ในชั้นใดชั้นหนึ่ง ไม่ใช่อยู่ได้ทั้งสองชั้น โดยปกติป้ายกำกับหรือบริบทจะบอกว่ารวมด้านใดไว้

คาดหวังว่าจะเห็นข้อมูลดิบอย่างละเอียด

ฮิสโตแกรมเป็นการสรุปข้อมูลแบบจัดกลุ่ม จึงแสดงรูปแบบได้ดี แต่ไม่สามารถย้อนกลับไปหาค่าดั้งเดิมทุกค่าได้เหมือนแผนภาพต้น-ใบ

ฮิสโตแกรมมีประโยชน์เมื่อใด

ฮิสโตแกรมมีประโยชน์เมื่อคุณต้องการเห็นภาพรวมอย่างรวดเร็วว่าข้อมูลเชิงตัวเลขกระจายอย่างไร มักใช้ในสถิติ ห้องปฏิบัติการวิทยาศาสตร์ คะแนนสอบ เวลาตอบสนอง และข้อมูลควบคุมคุณภาพ

ฮิสโตแกรมมีประโยชน์เป็นพิเศษก่อนคำนวณค่าสถิติสรุป เพราะช่วยให้เห็นว่าข้อมูลดูสมดุล เบ้ กระจุกตัว หรือกระจายกว้างผิดปกติหรือไม่

ขั้นต่อไปที่นำไปใช้ได้จริง

ลองนำข้อมูลเชิงตัวเลขชุดเล็ก ๆ มาแบ่งเป็นช่วงที่มีความกว้างเท่ากัน แล้วร่างฮิสโตแกรมด้วยมือ จากนั้นเขียนหนึ่งประโยคเพื่ออธิบายรูปแบบก่อนคำนวณค่าเฉลี่ยหรือมัธยฐาน ถ้าอยากไปต่อ ลองเปลี่ยนความกว้างชั้นแล้วดูว่าภาพรวมเปลี่ยนไปอย่างไร

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →