แผนภาพกระจายแสดงความสัมพันธ์ระหว่างตัวแปรเชิงตัวเลขสองตัว แต่ละจุดแทนค่าหนึ่งคู่ของข้อมูล จึงช่วยให้เห็นได้อย่างรวดเร็วว่าข้อมูลมีแนวโน้มเพิ่มขึ้น ลดลง กระจายตัว จับกลุ่ม หรือมีจุดที่ผิดปกติหรือไม่

จึงเป็นวิธีที่เร็วที่สุดในการตอบคำถามที่นักเรียนส่วนใหญ่อยากรู้จริง ๆ ว่า “ข้อมูลนี้กำลังบอกอะไรอยู่?” ก่อนจะคำนวณสหสัมพันธ์หรือวาดเส้นแนวโน้มที่เหมาะสมที่สุด กราฟจะบอกได้ก่อนว่าสรุปแบบนั้นสมเหตุสมผลหรือไม่

วิธีอ่านแผนภาพกระจาย

แกนนอนแสดงตัวแปรหนึ่ง และแกนตั้งแสดงอีกตัวแปรหนึ่ง ถ้านักเรียนคนหนึ่งอ่านหนังสือ 44 ชั่วโมงและได้คะแนน 7878 จุดนั้นคือ (4,78)(4,78)

เมื่อพล็อตจุดลงบนกราฟแล้ว ให้มองหารูปแบบโดยรวม:

  • สหสัมพันธ์เชิงบวก: จุดมีแนวโน้มสูงขึ้นจากซ้ายไปขวา
  • สหสัมพันธ์เชิงลบ: จุดมีแนวโน้มลดลงจากซ้ายไปขวา
  • สหสัมพันธ์น้อยหรือไม่ชัดเจน: จุดไม่แสดงแนวโน้มเชิงเส้นที่เด่นชัด

ควรตรวจดูด้วยว่ามีกลุ่มข้อมูล ช่องว่างระหว่างข้อมูล และค่าผิดปกติหรือไม่ ข้อมูลจริงแทบไม่เคยเรียงอยู่บนเส้นเดียวอย่างพอดี ดังนั้นเป้าหมายคือดูแนวโน้ม ไม่ใช่ความตรงเป๊ะของทุกจุด

สหสัมพันธ์หมายถึงอะไรในแผนภาพกระจาย

สหสัมพันธ์ใช้อธิบายทิศทางและความแรงของความสัมพันธ์เชิงเส้น คำว่า “เชิงเส้น” คือเงื่อนไขสำคัญ เพราะสหสัมพันธ์กำลังสรุปว่าจุดข้อมูลสอดคล้องกับแนวโน้มเส้นตรงได้ดีแค่ไหน

ถ้าจุดข้อมูลกระจุกอยู่รอบเส้นที่เอียงขึ้น สหสัมพันธ์จะเป็นบวก ถ้ากระจุกอยู่รอบเส้นที่เอียงลง สหสัมพันธ์จะเป็นลบ ถ้าจุดดูกระจัดกระจายและไม่มีทิศทางเส้นตรงที่ชัดเจน สหสัมพันธ์เชิงเส้นจะอ่อนหรือใกล้ศูนย์

รูปแบบที่เป็นเส้นโค้งก็ยังอาจแสดงความสัมพันธ์จริงได้ เพียงแต่อาจไม่มีสหสัมพันธ์เชิงเส้นที่แรง

เมื่อใดเส้นแนวโน้มที่เหมาะสมที่สุดจึงมีประโยชน์

เส้นแนวโน้มที่เหมาะสมที่สุดคือเส้นตรงที่วาดขึ้นเพื่อแทนแนวโน้มโดยรวมของจุดข้อมูล ไม่จำเป็นต้องผ่านทุกจุด หน้าที่ของมันคืออยู่ใกล้กับกลุ่มจุดโดยรวมให้มากที่สุด

ควรใช้เส้นแนวโน้มที่เหมาะสมที่สุดก็ต่อเมื่อแผนภาพกระจายมีลักษณะใกล้เคียงเชิงเส้น ในกรณีนั้น เส้นนี้ช่วยได้สองอย่าง:

  • สรุปแนวโน้ม
  • ใช้พยากรณ์คร่าว ๆ ภายในช่วงข้อมูลที่สังเกตได้

ถ้ารูปแบบเป็นเส้นโค้ง แยกเป็นหลายกลุ่ม หรือถูกครอบงำด้วยค่าผิดปกติ เส้นตรงที่เหมาะสมที่สุดอาจปิดบังข้อมูลมากกว่าช่วยอธิบาย

ตัวอย่างแผนภาพกระจาย: ชั่วโมงอ่านหนังสือและคะแนนควิซ

สมมติว่าครูบันทึกเวลาอ่านหนังสือและคะแนนควิซของนักเรียน 5 คนดังนี้:

(1,55), (2,61), (3,68), (4,74), (5,81)(1,55),\ (2,61),\ (3,68),\ (4,74),\ (5,81)

จุดเหล่านี้สูงขึ้นจากซ้ายไปขวาและอยู่ค่อนข้างใกล้เส้นตรง นั่นหมายความว่าความสัมพันธ์เป็นเชิงบวกและใกล้เคียงเชิงเส้น

ดังนั้นทั้งสหสัมพันธ์และเส้นแนวโน้มที่เหมาะสมที่สุดจึงเป็นตัวสรุปที่สมเหตุสมผลในกรณีนี้ คุณจะคาดว่าเส้นแนวโน้มที่เหมาะสมที่สุดมีความชันเป็นบวก เพราะเวลาอ่านหนังสือที่มากขึ้นมักสัมพันธ์กับคะแนนควิซที่สูงขึ้น

ตอนนี้เพิ่มอีกหนึ่งจุดที่ (5,40)(5,40) แนวโน้มโดยรวมอาจยังเป็นบวก แต่จุดนี้เป็นค่าผิดปกติ และอาจดึงเส้นแนวโน้มที่เหมาะสมที่สุดให้ต่ำลงได้ นี่จึงเป็นเหตุผลว่าทำไมควรดูกราฟก่อนสรุปผล เพราะภาพจะบอกได้ว่าตัวสรุปนั้นน่าเชื่อถือหรือไม่

ข้อผิดพลาดที่พบบ่อยในแผนภาพกระจาย

คิดว่าสหสัมพันธ์เท่ากับเหตุและผล

ถ้าตัวแปรสองตัวเปลี่ยนไปด้วยกัน ไม่ได้แปลว่าอีกตัวหนึ่งเป็นสาเหตุของอีกตัวโดยอัตโนมัติ อาจมีปัจจัยที่สามส่งผลต่อทั้งคู่ หรือรูปแบบอาจซับซ้อนกว่าที่เห็นในตอนแรก

ฝืนลากเส้นตรงลงบนรูปแบบที่เป็นเส้นโค้ง

ข้อมูลบางชุดเป็นไปตามเส้นโค้ง ไม่ใช่เส้นตรง ในกรณีนั้น เส้นแนวโน้มเชิงเส้นอาจให้ภาพสรุปที่ทำให้เข้าใจผิด

มองข้ามค่าผิดปกติ

จุดที่ผิดปกติเพียงจุดเดียวอาจเปลี่ยนแนวโน้มที่เห็นได้มาก ค่าผิดปกติไม่ได้แปลว่าข้อมูลผิดเสมอไป แต่ก็ไม่ควรถูกมองข้ามโดยไม่ตรวจสอบบริบท

ลืมไปว่าหนึ่งจุดแทนอะไร

แผนภาพกระจายใช้ได้กับข้อมูลแบบจับคู่เท่านั้น แต่ละจุดต้องมาจากข้อมูลหนึ่งรายการที่มีทั้งค่า xx และค่า yy

แผนภาพกระจายถูกใช้เมื่อใด

แผนภาพกระจายถูกใช้ในสถิติ วิทยาศาสตร์ ธุรกิจ และงานวิจัยทางสังคม เมื่อต้องการเปรียบเทียบตัวแปรเชิงตัวเลขสองตัว ตัวอย่างที่พบบ่อยคือ ส่วนสูงกับน้ำหนัก งบโฆษณากับยอดขาย หรือเวลาอ่านหนังสือกับคะแนนสอบ

แผนภาพชนิดนี้มีประโยชน์มากเป็นพิเศษในช่วงเริ่มต้นของการวิเคราะห์ เพราะสามารถเผยให้เห็นรูปแบบที่สูตรเพียงสูตรเดียวอาจซ่อนไว้ เช่น การจับกลุ่ม ช่องว่าง หรือค่าผิดปกติ

ลองทำโจทย์ที่คล้ายกัน

นำข้อมูลแบบจับคู่ชุดเล็ก ๆ มาพล็อตจุดก่อนคำนวณสหสัมพันธ์ แล้วถาม 3 ข้อ: รูปแบบสูงขึ้นหรือลดลง ดูใกล้เคียงเชิงเส้นหรือไม่ และมีจุดใดอยู่ไกลจากจุดอื่นอย่างผิดปกติหรือไม่

ถ้ารูปแบบดูใกล้เคียงเชิงเส้น ให้ลองศึกษาข้อมูลชุดเดิมต่อด้วยค่าสัมประสิทธิ์สหสัมพันธ์หรือเส้นแนวโน้มอย่างง่าย นั่นคือขั้นต่อไปตามธรรมชาติจากภาพไปสู่การสรุป

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →