ความแปรปรวนใช้วัดว่าค่าตัวเลขกระจายออกจากค่าเฉลี่ยมากน้อยเพียงใด ความแปรปรวนน้อยหมายความว่าค่าต่าง ๆ อยู่ค่อนข้างใกล้ค่าเฉลี่ย ความแปรปรวนมากหมายความว่าค่าต่าง ๆ กระจายห่างออกไปมากกว่า
ในการคำนวณความแปรปรวน ให้หาว่าแต่ละค่าห่างจากค่าเฉลี่ยเท่าใด ยกกำลังสองของระยะห่างนั้น แล้วนำมาเฉลี่ย การยกกำลังสองมีความสำคัญ เพราะถ้าไม่ทำเช่นนั้น ค่าคลาดเคลื่อนบวกและลบจะหักล้างกัน
สูตรความแปรปรวน: ประชากร เทียบกับ ตัวอย่าง
ใช้สูตรความแปรปรวนของประชากรเมื่อข้อมูลของคุณมีค่าครบทุกค่าในกลุ่มที่ต้องการอธิบาย:
ใช้สูตรความแปรปรวนของตัวอย่างเมื่อข้อมูลของคุณเป็นเพียงตัวอย่าง และคุณต้องการประมาณการการกระจายของประชากรที่ใหญ่กว่า:
ความแตกต่างมีเพียงตัวส่วนเท่านั้น ใช้ สำหรับประชากรทั้งหมด ใช้ สำหรับการประมาณจากตัวอย่าง
ความแปรปรวนบอกอะไร
ความแปรปรวนไม่ได้บอกว่าจุดศูนย์กลางอยู่ที่ไหน แต่มันบอกว่าข้อมูลมีแนวโน้มจะอยู่ห่างจากจุดศูนย์กลางนั้นมากเพียงใด
ถ้าชุดข้อมูลสองชุดมีค่าเฉลี่ยเท่ากัน ชุดที่มีความแปรปรวนมากกว่าจะมีค่าที่อยู่ห่างจากค่าเฉลี่ยมากกว่าโดยเฉลี่ย เนื่องจากมีการยกกำลังสองของค่าคลาดเคลื่อน ช่องว่างที่ใหญ่ผิดปกติจึงมีอิทธิพลมากเป็นพิเศษ
รายละเอียดสำคัญอย่างหนึ่งคือ ความแปรปรวนมีหน่วยเป็นกำลังสอง ถ้าข้อมูลมีหน่วยเป็นเมตร ความแปรปรวนจะมีหน่วยเป็นตารางเมตร นั่นจึงเป็นเหตุผลว่าทำไมส่วนเบี่ยงเบนมาตรฐานมักตีความได้ง่ายกว่าในการใช้งานทั่วไป
วิธีคำนวณความแปรปรวน: ตัวอย่างแบบทำให้ดู
ใช้ชุดข้อมูล
ขั้นแรก หาค่าเฉลี่ย:
จากนั้นลบค่าเฉลี่ยออกจากแต่ละค่า แล้วนำผลลัพธ์มายกกำลังสอง:
นำค่าคลาดเคลื่อนยกกำลังสองเหล่านั้นมาบวกกัน:
ถ้าค่าทั้งแปดนี้เป็นประชากรทั้งหมด ความแปรปรวนของประชากรคือ:
ถ้าค่าทั้งแปดเดียวกันนี้ถูกมองว่าเป็นตัวอย่างจากประชากรที่ใหญ่กว่า ความแปรปรวนของตัวอย่างคือ:
ตัวอย่างนี้แสดงแนวคิดหลักได้อย่างชัดเจน: ค่าคลาดเคลื่อนยกกำลังสองเหมือนเดิม แต่คำตอบสุดท้ายเปลี่ยนไปตามว่าคุณหารด้วย หรือ
ข้อผิดพลาดที่พบบ่อยเกี่ยวกับความแปรปรวน
- ลืมยกกำลังสองของค่าคลาดเคลื่อน ถ้าคุณเฉลี่ยค่าคลาดเคลื่อนแบบตรง ๆ ค่าบวกและค่าลบจะหักล้างกัน ทำให้วัดการกระจายได้ไม่ถูกต้อง
- สับสนระหว่างความแปรปรวนของประชากรกับของตัวอย่าง ให้หารด้วย สำหรับประชากรทั้งหมด และหารด้วย สำหรับตัวอย่างที่ใช้ประมาณประชากรที่ใหญ่กว่า
- ลืมว่าความแปรปรวนใช้หน่วยกำลังสอง ความแปรปรวนมีประโยชน์ แต่ส่วนเบี่ยงเบนมาตรฐานมักอ่านเข้าใจง่ายกว่า เพราะกลับไปใช้หน่วยเดิม
- คิดว่าความแปรปรวนมากเป็นเรื่องไม่ดีเสมอไป ความแปรปรวนที่มากขึ้นหมายถึงการกระจายมากขึ้นเท่านั้น จะสำคัญหรือไม่ขึ้นอยู่กับบริบท
ความแปรปรวนถูกใช้เมื่อใด
ความแปรปรวนถูกใช้ทุกครั้งที่คุณต้องการอธิบายหรือเปรียบเทียบการกระจายในรูปแบบที่สม่ำเสมอ
- ในวิชาสถิติ มันช่วยสรุปว่าชุดข้อมูลกระจายมากน้อยเพียงใด
- ในการควบคุมคุณภาพ มันช่วยติดตามได้ว่ากระบวนการยังคงมีความสม่ำเสมอตลอดเวลาหรือไม่
- ในการเงิน ความแปรปรวนใช้เพื่ออธิบายว่าผลตอบแทนผันผวนมากเพียงใด แม้ว่านี่จะเป็นเพียงหนึ่งในวิธีคิดเรื่องความเสี่ยง
- ในแมชชีนเลิร์นนิงและการวิเคราะห์ข้อมูล มันช่วยอธิบายว่าคุณลักษณะหรือความคลาดเคลื่อนเปลี่ยนแปลงไปอย่างไรในแต่ละการสังเกต
ลองทำโจทย์ที่คล้ายกัน
ลองสร้างแบบฝึกของคุณเองโดยใช้ชุดข้อมูลขนาดเล็กสองชุดที่มีค่าเฉลี่ยเท่ากัน แต่มีการกระจายต่างกัน คำนวณความแปรปรวนของทั้งสองชุด แล้วดูว่าชุดข้อมูลที่กระจายกว้างกว่าจะได้ค่ามากกว่าหรือไม่ การเปรียบเทียบเพียงครั้งเดียวแบบนี้มักช่วยให้เข้าใจแนวคิดได้ชัดเจน
ต้องการความช่วยเหลือในการแก้โจทย์?
อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที
เปิด GPAI Solver →