การวัดการกระจายของข้อมูลบอกว่าชุดข้อมูลกระจายออกจากกันมากน้อยเพียงใด การวัดพื้นฐาน 3 แบบคือ พิสัย ความแปรปรวน และ ส่วนเบี่ยงเบนมาตรฐาน พิสัยใช้เพียงค่าต่ำสุดและค่าสูงสุด ความแปรปรวนวัดระยะห่างยกกำลังสองเฉลี่ยจากค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน จึงทำให้ค่าการกระจายกลับมาอยู่ในหน่วยเดิม

ถ้าต้องการสรุปแบบเร็ว ให้ใช้พิสัยเพื่อดูภาพรวมเบื้องต้น ใช้ความแปรปรวนสำหรับงานสถิติที่เป็นทางการ และใช้ส่วนเบี่ยงเบนมาตรฐานเมื่อคุณต้องการค่าการกระจายที่ตีความได้ง่ายกว่า

พิสัย ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐานแบบสรุป

พิสัย คือระยะจากค่าน้อยที่สุดไปยังค่ามากที่สุด:

range=maximumminimum\text{range} = \text{maximum} - \text{minimum}

คำนวณได้รวดเร็ว แต่ใช้ข้อมูลเพียงสองค่าเท่านั้น ค่าสุดโต่งเพียงค่าเดียวก็อาจทำให้พิสัยเปลี่ยนไปมากได้

ความแปรปรวน วัดว่าค่าต่าง ๆ มักอยู่ห่างจากค่าเฉลี่ยมากเพียงใด หลังจากนำระยะห่างเหล่านั้นมายกกำลังสองแล้ว

สำหรับประชากรทั้งหมด

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

สำหรับกลุ่มตัวอย่างที่ใช้ประมาณค่าของประชากรที่ใหญ่กว่า

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

ใช้ NN เฉพาะเมื่อข้อมูลของคุณคือประชากรทั้งหมดที่คุณสนใจ ใช้ n1n-1 เมื่อข้อมูลของคุณเป็นกลุ่มตัวอย่างจากกลุ่มที่ใหญ่กว่า

ส่วนเบี่ยงเบนมาตรฐาน คือรากที่สองของความแปรปรวน:

σ=σ2\sigma = \sqrt{\sigma^2}

หรือสำหรับกลุ่มตัวอย่าง

s=s2s = \sqrt{s^2}

เพราะอยู่ในหน่วยเดิมของข้อมูล ส่วนเบี่ยงเบนมาตรฐานจึงมักอ่านและตีความได้ง่ายกว่าความแปรปรวน

ตัวอย่างคำนวณ: พิสัยเท่ากัน แต่การกระจายต่างกัน

เปรียบเทียบชุดข้อมูลสองชุดนี้:

  • ชุด A: 2,5,5,5,82, 5, 5, 5, 8
  • ชุด B: 2,2,5,8,82, 2, 5, 8, 8

ทั้งสองชุดมีค่าน้อยที่สุดเท่ากัน ค่ามากที่สุดเท่ากัน และค่าเฉลี่ยเท่ากัน

สำหรับแต่ละชุด

range=82=6\text{range} = 8 - 2 = 6

และ

mean=255=5\text{mean} = \frac{25}{5} = 5

ดังนั้น ถ้าดูจากพิสัยอย่างเดียว จะเหมือนว่าทั้งสองชุดกว้างเท่ากัน แต่การจัดเรียงค่ารอบค่าเฉลี่ยนั้นต่างกัน

ชุด A

ค่าคลาดเคลื่อนจากค่าเฉลี่ยคือ

3, 0, 0, 0, 3-3,\ 0,\ 0,\ 0,\ 3

เมื่อนำมายกกำลังสอง จะได้

9, 0, 0, 0, 99,\ 0,\ 0,\ 0,\ 9

ผลรวมของค่าคลาดเคลื่อนยกกำลังสองคือ 1818 ถ้าถือว่าข้อมูลนี้เป็นประชากรทั้งหมด

σ2=185=3.6\sigma^2 = \frac{18}{5} = 3.6

และ

σ=3.61.90\sigma = \sqrt{3.6} \approx 1.90

ชุด B

ค่าคลาดเคลื่อนจากค่าเฉลี่ยคือ

3, 3, 0, 3, 3-3,\ -3,\ 0,\ 3,\ 3

เมื่อนำมายกกำลังสอง จะได้

9, 9, 0, 9, 99,\ 9,\ 0,\ 9,\ 9

ผลรวมของค่าคลาดเคลื่อนยกกำลังสองคือ 3636 ดังนั้น

σ2=365=7.2\sigma^2 = \frac{36}{5} = 7.2

และ

σ=7.22.68\sigma = \sqrt{7.2} \approx 2.68

ทั้งสองชุดมีพิสัยเท่ากัน แต่ชุด B มีความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานมากกว่า นี่คือแนวคิดสำคัญ: พิสัยมองเห็นเพียงค่าปลายทั้งสองด้าน ขณะที่ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานใช้ข้อมูลทั้งชุด

ข้อผิดพลาดที่พบบ่อยเกี่ยวกับการวัดการกระจาย

ข้อผิดพลาดที่พบบ่อยอย่างหนึ่งคือคิดว่าถ้าพิสัยเท่ากัน การกระจายก็ต้องเท่ากัน ตัวอย่างข้างต้นแสดงให้เห็นว่าความคิดนี้ไม่ถูกต้อง

อีกข้อผิดพลาดหนึ่งคือมองว่าความแปรปรวนมีหน่วยเดียวกับข้อมูลเดิม ซึ่งไม่ใช่ ถ้าข้อมูลมีหน่วยเป็นเมตร ความแปรปรวนจะมีหน่วยเป็นตารางเมตร

ข้อผิดพลาดข้อที่สามคือสับสนระหว่างสูตรของประชากรกับสูตรของกลุ่มตัวอย่าง ตัวส่วนที่ถูกต้องขึ้นอยู่กับสถานการณ์: ใช้ NN สำหรับประชากรทั้งหมด และใช้ n1n-1 สำหรับกลุ่มตัวอย่าง

นอกจากนี้ ควรจำไว้ว่าความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานไวต่อค่าผิดปกติ เพราะค่าคลาดเคลื่อนขนาดใหญ่จะถูกยกกำลังสองก่อนนำมาเฉลี่ย

แต่ละการวัดเหมาะใช้เมื่อใด

ใช้ พิสัย เมื่อต้องการดูอย่างรวดเร็วว่าข้อมูลมีช่วงกว้างแค่ไหน

ใช้ ความแปรปรวน เมื่อต้องใช้ค่าการกระจายนี้ในวิธีการทางสถิติอื่น ๆ สูตรจำนวนมากในความน่าจะเป็นและสถิติสร้างอยู่บนความแปรปรวน แม้ว่าในรายงานภายหลังมักจะแสดงส่วนเบี่ยงเบนมาตรฐานแทน

ใช้ ส่วนเบี่ยงเบนมาตรฐาน เมื่อต้องการคำอธิบายการกระจายที่ใช้งานได้จริงในหน่วยเดียวกับข้อมูล ในการสรุปผลทั้งในห้องเรียนและสถานการณ์จริง มักเป็นตัวเลือกที่อ่านเข้าใจง่ายที่สุด

ลองทำโจทย์ที่คล้ายกัน

สร้างชุดข้อมูลสั้น ๆ สองชุดที่มีค่าเฉลี่ยเท่ากันและพิสัยเท่ากัน แล้วเปรียบเทียบความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานของทั้งสองชุด ถ้าต้องการต่อยอด ลองทำเวอร์ชันของคุณเองในตัวแก้โจทย์หลังจากคำนวณด้วยมือเสร็จแล้ว

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →