การวัดการกระจายของข้อมูลบอกว่าชุดข้อมูลกระจายออกจากกันมากน้อยเพียงใด การวัดพื้นฐาน 3 แบบคือ พิสัย ความแปรปรวน และ ส่วนเบี่ยงเบนมาตรฐาน พิสัยใช้เพียงค่าต่ำสุดและค่าสูงสุด ความแปรปรวนวัดระยะห่างยกกำลังสองเฉลี่ยจากค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน จึงทำให้ค่าการกระจายกลับมาอยู่ในหน่วยเดิม
ถ้าต้องการสรุปแบบเร็ว ให้ใช้พิสัยเพื่อดูภาพรวมเบื้องต้น ใช้ความแปรปรวนสำหรับงานสถิติที่เป็นทางการ และใช้ส่วนเบี่ยงเบนมาตรฐานเมื่อคุณต้องการค่าการกระจายที่ตีความได้ง่ายกว่า
พิสัย ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐานแบบสรุป
พิสัย คือระยะจากค่าน้อยที่สุดไปยังค่ามากที่สุด:
คำนวณได้รวดเร็ว แต่ใช้ข้อมูลเพียงสองค่าเท่านั้น ค่าสุดโต่งเพียงค่าเดียวก็อาจทำให้พิสัยเปลี่ยนไปมากได้
ความแปรปรวน วัดว่าค่าต่าง ๆ มักอยู่ห่างจากค่าเฉลี่ยมากเพียงใด หลังจากนำระยะห่างเหล่านั้นมายกกำลังสองแล้ว
สำหรับประชากรทั้งหมด
สำหรับกลุ่มตัวอย่างที่ใช้ประมาณค่าของประชากรที่ใหญ่กว่า
ใช้ เฉพาะเมื่อข้อมูลของคุณคือประชากรทั้งหมดที่คุณสนใจ ใช้ เมื่อข้อมูลของคุณเป็นกลุ่มตัวอย่างจากกลุ่มที่ใหญ่กว่า
ส่วนเบี่ยงเบนมาตรฐาน คือรากที่สองของความแปรปรวน:
หรือสำหรับกลุ่มตัวอย่าง
เพราะอยู่ในหน่วยเดิมของข้อมูล ส่วนเบี่ยงเบนมาตรฐานจึงมักอ่านและตีความได้ง่ายกว่าความแปรปรวน
ตัวอย่างคำนวณ: พิสัยเท่ากัน แต่การกระจายต่างกัน
เปรียบเทียบชุดข้อมูลสองชุดนี้:
- ชุด A:
- ชุด B:
ทั้งสองชุดมีค่าน้อยที่สุดเท่ากัน ค่ามากที่สุดเท่ากัน และค่าเฉลี่ยเท่ากัน
สำหรับแต่ละชุด
และ
ดังนั้น ถ้าดูจากพิสัยอย่างเดียว จะเหมือนว่าทั้งสองชุดกว้างเท่ากัน แต่การจัดเรียงค่ารอบค่าเฉลี่ยนั้นต่างกัน
ชุด A
ค่าคลาดเคลื่อนจากค่าเฉลี่ยคือ
เมื่อนำมายกกำลังสอง จะได้
ผลรวมของค่าคลาดเคลื่อนยกกำลังสองคือ ถ้าถือว่าข้อมูลนี้เป็นประชากรทั้งหมด
และ
ชุด B
ค่าคลาดเคลื่อนจากค่าเฉลี่ยคือ
เมื่อนำมายกกำลังสอง จะได้
ผลรวมของค่าคลาดเคลื่อนยกกำลังสองคือ ดังนั้น
และ
ทั้งสองชุดมีพิสัยเท่ากัน แต่ชุด B มีความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานมากกว่า นี่คือแนวคิดสำคัญ: พิสัยมองเห็นเพียงค่าปลายทั้งสองด้าน ขณะที่ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานใช้ข้อมูลทั้งชุด
ข้อผิดพลาดที่พบบ่อยเกี่ยวกับการวัดการกระจาย
ข้อผิดพลาดที่พบบ่อยอย่างหนึ่งคือคิดว่าถ้าพิสัยเท่ากัน การกระจายก็ต้องเท่ากัน ตัวอย่างข้างต้นแสดงให้เห็นว่าความคิดนี้ไม่ถูกต้อง
อีกข้อผิดพลาดหนึ่งคือมองว่าความแปรปรวนมีหน่วยเดียวกับข้อมูลเดิม ซึ่งไม่ใช่ ถ้าข้อมูลมีหน่วยเป็นเมตร ความแปรปรวนจะมีหน่วยเป็นตารางเมตร
ข้อผิดพลาดข้อที่สามคือสับสนระหว่างสูตรของประชากรกับสูตรของกลุ่มตัวอย่าง ตัวส่วนที่ถูกต้องขึ้นอยู่กับสถานการณ์: ใช้ สำหรับประชากรทั้งหมด และใช้ สำหรับกลุ่มตัวอย่าง
นอกจากนี้ ควรจำไว้ว่าความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานไวต่อค่าผิดปกติ เพราะค่าคลาดเคลื่อนขนาดใหญ่จะถูกยกกำลังสองก่อนนำมาเฉลี่ย
แต่ละการวัดเหมาะใช้เมื่อใด
ใช้ พิสัย เมื่อต้องการดูอย่างรวดเร็วว่าข้อมูลมีช่วงกว้างแค่ไหน
ใช้ ความแปรปรวน เมื่อต้องใช้ค่าการกระจายนี้ในวิธีการทางสถิติอื่น ๆ สูตรจำนวนมากในความน่าจะเป็นและสถิติสร้างอยู่บนความแปรปรวน แม้ว่าในรายงานภายหลังมักจะแสดงส่วนเบี่ยงเบนมาตรฐานแทน
ใช้ ส่วนเบี่ยงเบนมาตรฐาน เมื่อต้องการคำอธิบายการกระจายที่ใช้งานได้จริงในหน่วยเดียวกับข้อมูล ในการสรุปผลทั้งในห้องเรียนและสถานการณ์จริง มักเป็นตัวเลือกที่อ่านเข้าใจง่ายที่สุด
ลองทำโจทย์ที่คล้ายกัน
สร้างชุดข้อมูลสั้น ๆ สองชุดที่มีค่าเฉลี่ยเท่ากันและพิสัยเท่ากัน แล้วเปรียบเทียบความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานของทั้งสองชุด ถ้าต้องการต่อยอด ลองทำเวอร์ชันของคุณเองในตัวแก้โจทย์หลังจากคำนวณด้วยมือเสร็จแล้ว
ต้องการความช่วยเหลือในการแก้โจทย์?
อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที
เปิด GPAI Solver →