ความแปรปรวน — สูตร วิธีคำนวณ และตัวอย่าง

ความแปรปรวนใช้วัดว่าค่าตัวเลขกระจายออกจากค่าเฉลี่ยมากน้อยเพียงใด ความแปรปรวนน้อยหมายความว่าค่าต่าง ๆ อยู่ค่อนข้างใกล้ค่าเฉลี่ย ความแปรปรวนมากหมายความว่าค่าต่าง ๆ กระจายห่างออกไปมากกว่า

ในการคำนวณความแปรปรวน ให้หาว่าแต่ละค่าห่างจากค่าเฉลี่ยเท่าใด ยกกำลังสองของระยะห่างนั้น แล้วนำมาเฉลี่ย การยกกำลังสองมีความสำคัญ เพราะถ้าไม่ทำเช่นนั้น ค่าคลาดเคลื่อนบวกและลบจะหักล้างกัน

สูตรความแปรปรวน: ประชากร เทียบกับ ตัวอย่าง

ใช้สูตรความแปรปรวนของประชากรเมื่อข้อมูลของคุณมีค่าครบทุกค่าในกลุ่มที่ต้องการอธิบาย:

\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

ใช้สูตรความแปรปรวนของตัวอย่างเมื่อข้อมูลของคุณเป็นเพียงตัวอย่าง และคุณต้องการประมาณการการกระจายของประชากรที่ใหญ่กว่า:

s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

ความแตกต่างมีเพียงตัวส่วนเท่านั้น ใช้ $N$ สำหรับประชากรทั้งหมด ใช้ $n-1$ สำหรับการประมาณจากตัวอย่าง

ความแปรปรวนบอกอะไร

ความแปรปรวนไม่ได้บอกว่าจุดศูนย์กลางอยู่ที่ไหน แต่มันบอกว่าข้อมูลมีแนวโน้มจะอยู่ห่างจากจุดศูนย์กลางนั้นมากเพียงใด

ถ้าชุดข้อมูลสองชุดมีค่าเฉลี่ยเท่ากัน ชุดที่มีความแปรปรวนมากกว่าจะมีค่าที่อยู่ห่างจากค่าเฉลี่ยมากกว่าโดยเฉลี่ย เนื่องจากมีการยกกำลังสองของค่าคลาดเคลื่อน ช่องว่างที่ใหญ่ผิดปกติจึงมีอิทธิพลมากเป็นพิเศษ

รายละเอียดสำคัญอย่างหนึ่งคือ ความแปรปรวนมีหน่วยเป็นกำลังสอง ถ้าข้อมูลมีหน่วยเป็นเมตร ความแปรปรวนจะมีหน่วยเป็นตารางเมตร นั่นจึงเป็นเหตุผลว่าทำไมส่วนเบี่ยงเบนมาตรฐานมักตีความได้ง่ายกว่าในการใช้งานทั่วไป

วิธีคำนวณความแปรปรวน: ตัวอย่างแบบทำให้ดู

ใช้ชุดข้อมูล $2, 4, 4, 4, 5, 5, 7, 9$

ขั้นแรก หาค่าเฉลี่ย:

\bar{x} = \frac{2+4+4+4+5+5+7+9}{8} = \frac{40}{8} = 5

จากนั้นลบค่าเฉลี่ยออกจากแต่ละค่า แล้วนำผลลัพธ์มายกกำลังสอง:

$(2-5)^2 = 9$
$(4-5)^2 = 1$
$(4-5)^2 = 1$
$(4-5)^2 = 1$
$(5-5)^2 = 0$
$(5-5)^2 = 0$
$(7-5)^2 = 4$
$(9-5)^2 = 16$

นำค่าคลาดเคลื่อนยกกำลังสองเหล่านั้นมาบวกกัน:

9+1+1+1+0+0+4+16 = 32

ถ้าค่าทั้งแปดนี้เป็นประชากรทั้งหมด ความแปรปรวนของประชากรคือ:

\sigma^2 = \frac{32}{8} = 4

ถ้าค่าทั้งแปดเดียวกันนี้ถูกมองว่าเป็นตัวอย่างจากประชากรที่ใหญ่กว่า ความแปรปรวนของตัวอย่างคือ:

s^2 = \frac{32}{7} \approx 4.57

ตัวอย่างนี้แสดงแนวคิดหลักได้อย่างชัดเจน: ค่าคลาดเคลื่อนยกกำลังสองเหมือนเดิม แต่คำตอบสุดท้ายเปลี่ยนไปตามว่าคุณหารด้วย $N$ หรือ $n-1$

ข้อผิดพลาดที่พบบ่อยเกี่ยวกับความแปรปรวน

ลืมยกกำลังสองของค่าคลาดเคลื่อน ถ้าคุณเฉลี่ยค่าคลาดเคลื่อนแบบตรง ๆ ค่าบวกและค่าลบจะหักล้างกัน ทำให้วัดการกระจายได้ไม่ถูกต้อง
สับสนระหว่างความแปรปรวนของประชากรกับของตัวอย่าง ให้หารด้วย $N$ สำหรับประชากรทั้งหมด และหารด้วย $n-1$ สำหรับตัวอย่างที่ใช้ประมาณประชากรที่ใหญ่กว่า
ลืมว่าความแปรปรวนใช้หน่วยกำลังสอง ความแปรปรวนมีประโยชน์ แต่ส่วนเบี่ยงเบนมาตรฐานมักอ่านเข้าใจง่ายกว่า เพราะกลับไปใช้หน่วยเดิม
คิดว่าความแปรปรวนมากเป็นเรื่องไม่ดีเสมอไป ความแปรปรวนที่มากขึ้นหมายถึงการกระจายมากขึ้นเท่านั้น จะสำคัญหรือไม่ขึ้นอยู่กับบริบท

ความแปรปรวนถูกใช้เมื่อใด

ความแปรปรวนถูกใช้ทุกครั้งที่คุณต้องการอธิบายหรือเปรียบเทียบการกระจายในรูปแบบที่สม่ำเสมอ

ในวิชาสถิติ มันช่วยสรุปว่าชุดข้อมูลกระจายมากน้อยเพียงใด
ในการควบคุมคุณภาพ มันช่วยติดตามได้ว่ากระบวนการยังคงมีความสม่ำเสมอตลอดเวลาหรือไม่
ในการเงิน ความแปรปรวนใช้เพื่ออธิบายว่าผลตอบแทนผันผวนมากเพียงใด แม้ว่านี่จะเป็นเพียงหนึ่งในวิธีคิดเรื่องความเสี่ยง
ในแมชชีนเลิร์นนิงและการวิเคราะห์ข้อมูล มันช่วยอธิบายว่าคุณลักษณะหรือความคลาดเคลื่อนเปลี่ยนแปลงไปอย่างไรในแต่ละการสังเกต

ลองทำโจทย์ที่คล้ายกัน

ลองสร้างแบบฝึกของคุณเองโดยใช้ชุดข้อมูลขนาดเล็กสองชุดที่มีค่าเฉลี่ยเท่ากัน แต่มีการกระจายต่างกัน คำนวณความแปรปรวนของทั้งสองชุด แล้วดูว่าชุดข้อมูลที่กระจายกว้างกว่าจะได้ค่ามากกว่าหรือไม่ การเปรียบเทียบเพียงครั้งเดียวแบบนี้มักช่วยให้เข้าใจแนวคิดได้ชัดเจน

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →