แผนภาพกระจายแสดงความสัมพันธ์ระหว่างตัวแปรเชิงตัวเลขสองตัว แต่ละจุดแทนค่าหนึ่งคู่ของข้อมูล จึงช่วยให้เห็นได้อย่างรวดเร็วว่าข้อมูลมีแนวโน้มเพิ่มขึ้น ลดลง กระจายตัว จับกลุ่ม หรือมีจุดที่ผิดปกติหรือไม่
จึงเป็นวิธีที่เร็วที่สุดในการตอบคำถามที่นักเรียนส่วนใหญ่อยากรู้จริง ๆ ว่า “ข้อมูลนี้กำลังบอกอะไรอยู่?” ก่อนจะคำนวณสหสัมพันธ์หรือวาดเส้นแนวโน้มที่เหมาะสมที่สุด กราฟจะบอกได้ก่อนว่าสรุปแบบนั้นสมเหตุสมผลหรือไม่
วิธีอ่านแผนภาพกระจาย
แกนนอนแสดงตัวแปรหนึ่ง และแกนตั้งแสดงอีกตัวแปรหนึ่ง ถ้านักเรียนคนหนึ่งอ่านหนังสือ ชั่วโมงและได้คะแนน จุดนั้นคือ
เมื่อพล็อตจุดลงบนกราฟแล้ว ให้มองหารูปแบบโดยรวม:
- สหสัมพันธ์เชิงบวก: จุดมีแนวโน้มสูงขึ้นจากซ้ายไปขวา
- สหสัมพันธ์เชิงลบ: จุดมีแนวโน้มลดลงจากซ้ายไปขวา
- สหสัมพันธ์น้อยหรือไม่ชัดเจน: จุดไม่แสดงแนวโน้มเชิงเส้นที่เด่นชัด
ควรตรวจดูด้วยว่ามีกลุ่มข้อมูล ช่องว่างระหว่างข้อมูล และค่าผิดปกติหรือไม่ ข้อมูลจริงแทบไม่เคยเรียงอยู่บนเส้นเดียวอย่างพอดี ดังนั้นเป้าหมายคือดูแนวโน้ม ไม่ใช่ความตรงเป๊ะของทุกจุด
สหสัมพันธ์หมายถึงอะไรในแผนภาพกระจาย
สหสัมพันธ์ใช้อธิบายทิศทางและความแรงของความสัมพันธ์เชิงเส้น คำว่า “เชิงเส้น” คือเงื่อนไขสำคัญ เพราะสหสัมพันธ์กำลังสรุปว่าจุดข้อมูลสอดคล้องกับแนวโน้มเส้นตรงได้ดีแค่ไหน
ถ้าจุดข้อมูลกระจุกอยู่รอบเส้นที่เอียงขึ้น สหสัมพันธ์จะเป็นบวก ถ้ากระจุกอยู่รอบเส้นที่เอียงลง สหสัมพันธ์จะเป็นลบ ถ้าจุดดูกระจัดกระจายและไม่มีทิศทางเส้นตรงที่ชัดเจน สหสัมพันธ์เชิงเส้นจะอ่อนหรือใกล้ศูนย์
รูปแบบที่เป็นเส้นโค้งก็ยังอาจแสดงความสัมพันธ์จริงได้ เพียงแต่อาจไม่มีสหสัมพันธ์เชิงเส้นที่แรง
เมื่อใดเส้นแนวโน้มที่เหมาะสมที่สุดจึงมีประโยชน์
เส้นแนวโน้มที่เหมาะสมที่สุดคือเส้นตรงที่วาดขึ้นเพื่อแทนแนวโน้มโดยรวมของจุดข้อมูล ไม่จำเป็นต้องผ่านทุกจุด หน้าที่ของมันคืออยู่ใกล้กับกลุ่มจุดโดยรวมให้มากที่สุด
ควรใช้เส้นแนวโน้มที่เหมาะสมที่สุดก็ต่อเมื่อแผนภาพกระจายมีลักษณะใกล้เคียงเชิงเส้น ในกรณีนั้น เส้นนี้ช่วยได้สองอย่าง:
- สรุปแนวโน้ม
- ใช้พยากรณ์คร่าว ๆ ภายในช่วงข้อมูลที่สังเกตได้
ถ้ารูปแบบเป็นเส้นโค้ง แยกเป็นหลายกลุ่ม หรือถูกครอบงำด้วยค่าผิดปกติ เส้นตรงที่เหมาะสมที่สุดอาจปิดบังข้อมูลมากกว่าช่วยอธิบาย
ตัวอย่างแผนภาพกระจาย: ชั่วโมงอ่านหนังสือและคะแนนควิซ
สมมติว่าครูบันทึกเวลาอ่านหนังสือและคะแนนควิซของนักเรียน 5 คนดังนี้:
จุดเหล่านี้สูงขึ้นจากซ้ายไปขวาและอยู่ค่อนข้างใกล้เส้นตรง นั่นหมายความว่าความสัมพันธ์เป็นเชิงบวกและใกล้เคียงเชิงเส้น
ดังนั้นทั้งสหสัมพันธ์และเส้นแนวโน้มที่เหมาะสมที่สุดจึงเป็นตัวสรุปที่สมเหตุสมผลในกรณีนี้ คุณจะคาดว่าเส้นแนวโน้มที่เหมาะสมที่สุดมีความชันเป็นบวก เพราะเวลาอ่านหนังสือที่มากขึ้นมักสัมพันธ์กับคะแนนควิซที่สูงขึ้น
ตอนนี้เพิ่มอีกหนึ่งจุดที่ แนวโน้มโดยรวมอาจยังเป็นบวก แต่จุดนี้เป็นค่าผิดปกติ และอาจดึงเส้นแนวโน้มที่เหมาะสมที่สุดให้ต่ำลงได้ นี่จึงเป็นเหตุผลว่าทำไมควรดูกราฟก่อนสรุปผล เพราะภาพจะบอกได้ว่าตัวสรุปนั้นน่าเชื่อถือหรือไม่
ข้อผิดพลาดที่พบบ่อยในแผนภาพกระจาย
คิดว่าสหสัมพันธ์เท่ากับเหตุและผล
ถ้าตัวแปรสองตัวเปลี่ยนไปด้วยกัน ไม่ได้แปลว่าอีกตัวหนึ่งเป็นสาเหตุของอีกตัวโดยอัตโนมัติ อาจมีปัจจัยที่สามส่งผลต่อทั้งคู่ หรือรูปแบบอาจซับซ้อนกว่าที่เห็นในตอนแรก
ฝืนลากเส้นตรงลงบนรูปแบบที่เป็นเส้นโค้ง
ข้อมูลบางชุดเป็นไปตามเส้นโค้ง ไม่ใช่เส้นตรง ในกรณีนั้น เส้นแนวโน้มเชิงเส้นอาจให้ภาพสรุปที่ทำให้เข้าใจผิด
มองข้ามค่าผิดปกติ
จุดที่ผิดปกติเพียงจุดเดียวอาจเปลี่ยนแนวโน้มที่เห็นได้มาก ค่าผิดปกติไม่ได้แปลว่าข้อมูลผิดเสมอไป แต่ก็ไม่ควรถูกมองข้ามโดยไม่ตรวจสอบบริบท
ลืมไปว่าหนึ่งจุดแทนอะไร
แผนภาพกระจายใช้ได้กับข้อมูลแบบจับคู่เท่านั้น แต่ละจุดต้องมาจากข้อมูลหนึ่งรายการที่มีทั้งค่า และค่า
แผนภาพกระจายถูกใช้เมื่อใด
แผนภาพกระจายถูกใช้ในสถิติ วิทยาศาสตร์ ธุรกิจ และงานวิจัยทางสังคม เมื่อต้องการเปรียบเทียบตัวแปรเชิงตัวเลขสองตัว ตัวอย่างที่พบบ่อยคือ ส่วนสูงกับน้ำหนัก งบโฆษณากับยอดขาย หรือเวลาอ่านหนังสือกับคะแนนสอบ
แผนภาพชนิดนี้มีประโยชน์มากเป็นพิเศษในช่วงเริ่มต้นของการวิเคราะห์ เพราะสามารถเผยให้เห็นรูปแบบที่สูตรเพียงสูตรเดียวอาจซ่อนไว้ เช่น การจับกลุ่ม ช่องว่าง หรือค่าผิดปกติ
ลองทำโจทย์ที่คล้ายกัน
นำข้อมูลแบบจับคู่ชุดเล็ก ๆ มาพล็อตจุดก่อนคำนวณสหสัมพันธ์ แล้วถาม 3 ข้อ: รูปแบบสูงขึ้นหรือลดลง ดูใกล้เคียงเชิงเส้นหรือไม่ และมีจุดใดอยู่ไกลจากจุดอื่นอย่างผิดปกติหรือไม่
ถ้ารูปแบบดูใกล้เคียงเชิงเส้น ให้ลองศึกษาข้อมูลชุดเดิมต่อด้วยค่าสัมประสิทธิ์สหสัมพันธ์หรือเส้นแนวโน้มอย่างง่าย นั่นคือขั้นต่อไปตามธรรมชาติจากภาพไปสู่การสรุป
ต้องการความช่วยเหลือในการแก้โจทย์?
อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที
เปิด GPAI Solver →