ความแปรปรวนใช้วัดว่าค่าตัวเลขกระจายออกจากค่าเฉลี่ยมากน้อยเพียงใด ความแปรปรวนน้อยหมายความว่าค่าต่าง ๆ อยู่ค่อนข้างใกล้ค่าเฉลี่ย ความแปรปรวนมากหมายความว่าค่าต่าง ๆ กระจายห่างออกไปมากกว่า

ในการคำนวณความแปรปรวน ให้หาว่าแต่ละค่าห่างจากค่าเฉลี่ยเท่าใด ยกกำลังสองของระยะห่างนั้น แล้วนำมาเฉลี่ย การยกกำลังสองมีความสำคัญ เพราะถ้าไม่ทำเช่นนั้น ค่าคลาดเคลื่อนบวกและลบจะหักล้างกัน

สูตรความแปรปรวน: ประชากร เทียบกับ ตัวอย่าง

ใช้สูตรความแปรปรวนของประชากรเมื่อข้อมูลของคุณมีค่าครบทุกค่าในกลุ่มที่ต้องการอธิบาย:

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

ใช้สูตรความแปรปรวนของตัวอย่างเมื่อข้อมูลของคุณเป็นเพียงตัวอย่าง และคุณต้องการประมาณการการกระจายของประชากรที่ใหญ่กว่า:

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

ความแตกต่างมีเพียงตัวส่วนเท่านั้น ใช้ NN สำหรับประชากรทั้งหมด ใช้ n1n-1 สำหรับการประมาณจากตัวอย่าง

ความแปรปรวนบอกอะไร

ความแปรปรวนไม่ได้บอกว่าจุดศูนย์กลางอยู่ที่ไหน แต่มันบอกว่าข้อมูลมีแนวโน้มจะอยู่ห่างจากจุดศูนย์กลางนั้นมากเพียงใด

ถ้าชุดข้อมูลสองชุดมีค่าเฉลี่ยเท่ากัน ชุดที่มีความแปรปรวนมากกว่าจะมีค่าที่อยู่ห่างจากค่าเฉลี่ยมากกว่าโดยเฉลี่ย เนื่องจากมีการยกกำลังสองของค่าคลาดเคลื่อน ช่องว่างที่ใหญ่ผิดปกติจึงมีอิทธิพลมากเป็นพิเศษ

รายละเอียดสำคัญอย่างหนึ่งคือ ความแปรปรวนมีหน่วยเป็นกำลังสอง ถ้าข้อมูลมีหน่วยเป็นเมตร ความแปรปรวนจะมีหน่วยเป็นตารางเมตร นั่นจึงเป็นเหตุผลว่าทำไมส่วนเบี่ยงเบนมาตรฐานมักตีความได้ง่ายกว่าในการใช้งานทั่วไป

วิธีคำนวณความแปรปรวน: ตัวอย่างแบบทำให้ดู

ใช้ชุดข้อมูล 2,4,4,4,5,5,7,92, 4, 4, 4, 5, 5, 7, 9

ขั้นแรก หาค่าเฉลี่ย:

xˉ=2+4+4+4+5+5+7+98=408=5\bar{x} = \frac{2+4+4+4+5+5+7+9}{8} = \frac{40}{8} = 5

จากนั้นลบค่าเฉลี่ยออกจากแต่ละค่า แล้วนำผลลัพธ์มายกกำลังสอง:

  • (25)2=9(2-5)^2 = 9
  • (45)2=1(4-5)^2 = 1
  • (45)2=1(4-5)^2 = 1
  • (45)2=1(4-5)^2 = 1
  • (55)2=0(5-5)^2 = 0
  • (55)2=0(5-5)^2 = 0
  • (75)2=4(7-5)^2 = 4
  • (95)2=16(9-5)^2 = 16

นำค่าคลาดเคลื่อนยกกำลังสองเหล่านั้นมาบวกกัน:

9+1+1+1+0+0+4+16=329+1+1+1+0+0+4+16 = 32

ถ้าค่าทั้งแปดนี้เป็นประชากรทั้งหมด ความแปรปรวนของประชากรคือ:

σ2=328=4\sigma^2 = \frac{32}{8} = 4

ถ้าค่าทั้งแปดเดียวกันนี้ถูกมองว่าเป็นตัวอย่างจากประชากรที่ใหญ่กว่า ความแปรปรวนของตัวอย่างคือ:

s2=3274.57s^2 = \frac{32}{7} \approx 4.57

ตัวอย่างนี้แสดงแนวคิดหลักได้อย่างชัดเจน: ค่าคลาดเคลื่อนยกกำลังสองเหมือนเดิม แต่คำตอบสุดท้ายเปลี่ยนไปตามว่าคุณหารด้วย NN หรือ n1n-1

ข้อผิดพลาดที่พบบ่อยเกี่ยวกับความแปรปรวน

  • ลืมยกกำลังสองของค่าคลาดเคลื่อน ถ้าคุณเฉลี่ยค่าคลาดเคลื่อนแบบตรง ๆ ค่าบวกและค่าลบจะหักล้างกัน ทำให้วัดการกระจายได้ไม่ถูกต้อง
  • สับสนระหว่างความแปรปรวนของประชากรกับของตัวอย่าง ให้หารด้วย NN สำหรับประชากรทั้งหมด และหารด้วย n1n-1 สำหรับตัวอย่างที่ใช้ประมาณประชากรที่ใหญ่กว่า
  • ลืมว่าความแปรปรวนใช้หน่วยกำลังสอง ความแปรปรวนมีประโยชน์ แต่ส่วนเบี่ยงเบนมาตรฐานมักอ่านเข้าใจง่ายกว่า เพราะกลับไปใช้หน่วยเดิม
  • คิดว่าความแปรปรวนมากเป็นเรื่องไม่ดีเสมอไป ความแปรปรวนที่มากขึ้นหมายถึงการกระจายมากขึ้นเท่านั้น จะสำคัญหรือไม่ขึ้นอยู่กับบริบท

ความแปรปรวนถูกใช้เมื่อใด

ความแปรปรวนถูกใช้ทุกครั้งที่คุณต้องการอธิบายหรือเปรียบเทียบการกระจายในรูปแบบที่สม่ำเสมอ

  • ในวิชาสถิติ มันช่วยสรุปว่าชุดข้อมูลกระจายมากน้อยเพียงใด
  • ในการควบคุมคุณภาพ มันช่วยติดตามได้ว่ากระบวนการยังคงมีความสม่ำเสมอตลอดเวลาหรือไม่
  • ในการเงิน ความแปรปรวนใช้เพื่ออธิบายว่าผลตอบแทนผันผวนมากเพียงใด แม้ว่านี่จะเป็นเพียงหนึ่งในวิธีคิดเรื่องความเสี่ยง
  • ในแมชชีนเลิร์นนิงและการวิเคราะห์ข้อมูล มันช่วยอธิบายว่าคุณลักษณะหรือความคลาดเคลื่อนเปลี่ยนแปลงไปอย่างไรในแต่ละการสังเกต

ลองทำโจทย์ที่คล้ายกัน

ลองสร้างแบบฝึกของคุณเองโดยใช้ชุดข้อมูลขนาดเล็กสองชุดที่มีค่าเฉลี่ยเท่ากัน แต่มีการกระจายต่างกัน คำนวณความแปรปรวนของทั้งสองชุด แล้วดูว่าชุดข้อมูลที่กระจายกว้างกว่าจะได้ค่ามากกว่าหรือไม่ การเปรียบเทียบเพียงครั้งเดียวแบบนี้มักช่วยให้เข้าใจแนวคิดได้ชัดเจน

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →