ประเภทของข้อมูลในสถิติบอกว่าตัวแปรนั้นแทนอะไร หากค่าที่ได้เป็นป้ายกำกับ เช่น "สีแดง" หรือ "ชีววิทยา" ข้อมูลนั้นเป็น เชิงคุณภาพ แต่ถ้าค่าเป็นปริมาณเชิงตัวเลข ข้อมูลนั้นเป็น เชิงปริมาณ จากนั้นสำหรับข้อมูลเชิงปริมาณ มักต้องถามต่ออีกหนึ่งข้อว่าเป็นการนับแบบ ไม่ต่อเนื่อง หรือเป็นการวัดแบบ ต่อเนื่อง
เรื่องนี้สำคัญ เพราะประเภทของข้อมูลมีผลต่อการเลือกกราฟ ค่าสรุป และแบบจำลองที่เหมาะสม ค่าเฉลี่ยอาจมีประโยชน์กับส่วนสูง แต่ใช้ไม่ได้กับสีตา
ข้อมูลเชิงคุณภาพ vs ข้อมูลเชิงปริมาณ
ข้อมูลเชิงคุณภาพหมายถึงข้อมูลแบบจัดเป็นหมวดหมู่
ข้อมูลเชิงคุณภาพใช้อธิบายลักษณะ กลุ่ม หรือป้ายกำกับ มากกว่าจะเป็นปริมาณเชิงตัวเลข ตัวอย่างเช่น สีรถ กรุ๊ปเลือด และประเทศ
ข้อมูลชนิดนี้มักเรียกอีกอย่างว่า ข้อมูลเชิงหมวดหมู่
ข้อมูลเชิงปริมาณหมายถึงปริมาณเชิงตัวเลข
ข้อมูลเชิงปริมาณบันทึกค่าที่เป็นจำนวนเชิงตัวเลข ตัวเลขนั้นไม่ได้เป็นเพียงป้ายกำกับ แต่แสดงถึงปริมาณ จำนวน หรือระยะ
ตัวอย่างได้แก่ อายุ ส่วนสูง คะแนนสอบ และจำนวนสัตว์เลี้ยง
ข้อมูลไม่ต่อเนื่อง vs ข้อมูลต่อเนื่อง
ข้อมูลไม่ต่อเนื่องมาจากการนับ
ข้อมูลไม่ต่อเนื่องเป็นข้อมูลเชิงปริมาณที่มักได้มาจากการนับ ค่าไม่ได้ครอบคลุมทุกค่าภายในช่วง แต่จะกระโดดจากค่าที่เป็นไปได้ค่าหนึ่งไปยังอีกค่าหนึ่ง
จำนวนนักเรียนในห้องเป็นข้อมูลไม่ต่อเนื่อง เพราะเรานับเป็นจำนวนนักเรียนเต็มคน ภายใต้แบบจำลองการนับทั่วไป ค่าอย่าง คนจึงไม่มีความหมาย
ข้อมูลต่อเนื่องมาจากการวัด
ข้อมูลต่อเนื่องเป็นข้อมูลเชิงปริมาณที่มักได้มาจากการวัด โดยหลักการแล้ว ค่าสามารถบันทึกได้ละเอียดขึ้นเรื่อย ๆ ตามเครื่องมือวัดและบริบทที่ใช้
ส่วนสูง เวลา และอุณหภูมิเป็นตัวอย่างมาตรฐาน ส่วนสูงของคนคนหนึ่งอาจเขียนเป็น ซม., ซม. หรือ ซม. ขึ้นอยู่กับระดับความละเอียดที่ใช้
ตัวอย่างแบบทำให้ดู: การจำแนกข้อมูลของนักเรียน
สมมติว่าโรงเรียนบันทึกตัวแปร 4 ตัวต่อไปนี้สำหรับนักเรียนแต่ละคน:
- ห้องประจำ
- จำนวนพี่น้อง
- เวลาเดินทางมาโรงเรียน
- วิชาที่ชอบ
ต่อไปนี้คือวิธีจำแนกข้อมูลเหล่านี้
ห้องประจำ เป็นข้อมูลเชิงคุณภาพ เพราะเป็นป้ายกำกับของกลุ่ม
จำนวนพี่น้อง เป็นข้อมูลเชิงปริมาณและไม่ต่อเนื่อง เพราะเป็นการนับ: และต่อไปเรื่อย ๆ
เวลาเดินทางมาโรงเรียน เป็นข้อมูลเชิงปริมาณและต่อเนื่อง เพราะได้มาจากการวัด คุณอาจปัดเป็นนาทีที่ใกล้ที่สุด แต่ตัวแปรจริงสามารถเปลี่ยนแปลงได้ละเอียดกว่านั้น
วิชาที่ชอบ เป็นข้อมูลเชิงคุณภาพ เพราะเป็นชื่อหมวดหมู่ ไม่ใช่ปริมาณ
ตัวอย่างนี้แสดงเส้นทางการตัดสินใจหลัก เริ่มจากถามก่อนว่า "เป็นป้ายกำกับหรือเป็นปริมาณ?" ถ้าเป็นปริมาณ ให้ถามต่อว่า "เป็นการนับหรือการวัด?"
จะดูอย่างไรว่าข้อมูลเป็นประเภทไหน
ใช้หลักจำง่าย ๆ นี้:
- ถ้าการหาค่าเฉลี่ยของค่าต่าง ๆ ไม่มีความหมาย ข้อมูลนั้นน่าจะเป็นข้อมูลเชิงคุณภาพ
- ถ้าการหาค่าเฉลี่ยมีความหมาย ข้อมูลนั้นน่าจะเป็นข้อมูลเชิงปริมาณ
- ถ้าค่าเชิงปริมาณมาจากการนับสิ่งที่แยกจากกัน มักเป็นข้อมูลไม่ต่อเนื่อง
- ถ้าค่ามาจากการวัดบนสเกล มักเป็นข้อมูลต่อเนื่อง
นี่เป็นทางลัดเชิงปฏิบัติ ไม่ใช่ข้อพิสูจน์อย่างเป็นทางการ บริบทของตัวแปรยังคงสำคัญเสมอ
ข้อผิดพลาดที่พบบ่อยเกี่ยวกับประเภทข้อมูลในสถิติ
มองรหัสตัวเลขว่าเป็นปริมาณจริง
ถ้าคำตอบในแบบสำรวจถูกเข้ารหัสเป็น , และ ตัวเลขเหล่านั้นก็อาจยังแทนหมวดหมู่ ไม่ใช่ปริมาณจริง การมีตัวเลขอยู่ในข้อมูลไม่ได้แปลว่าตัวแปรนั้นเป็นเชิงปริมาณโดยอัตโนมัติ
คิดว่าค่าที่เป็นจำนวนเต็มทุกค่าต้องเป็นข้อมูลไม่ต่อเนื่อง
ค่าที่วัดได้อาจดูเป็นจำนวนเต็มเพียงเพราะถูกปัดเศษ ตัวอย่างเช่น น้ำหนักที่บันทึกเป็น , และ กิโลกรัม ก็ยังเป็นข้อมูลต่อเนื่อง หากน้ำหนักนั้นได้มาจากการวัด ไม่ใช่การนับ
สับสนระหว่างตัวแปรกับวิธีที่เก็บข้อมูล
เวลาเดินทางที่ปัดเป็นนาทีที่ใกล้ที่สุดมักถูกเก็บเป็นจำนวนเต็ม แต่ตัวแปรนั้นเองยังคงเป็นข้อมูลต่อเนื่อง รูปแบบการบันทึกไม่ได้เปลี่ยนประเภทพื้นฐานของข้อมูลเสมอไป
ประเภทข้อมูลเหล่านี้ถูกใช้ในสถิติอย่างไร
การจำแนกประเภทนี้สำคัญทุกครั้งที่คุณต้องเลือกกราฟ ค่าสรุป หรือวิธีการทางสถิติ
สำหรับข้อมูลเชิงคุณภาพ มักใช้แผนภูมิแท่งและตารางความถี่ สำหรับข้อมูลเชิงปริมาณ อาจใช้ฮิสโตแกรม แผนภาพกล่อง ค่าเฉลี่ย มัธยฐาน และส่วนเบี่ยงเบนมาตรฐาน
การแยกระหว่างข้อมูลไม่ต่อเนื่องกับข้อมูลต่อเนื่องก็สำคัญเมื่อเลือกแบบจำลองความน่าจะเป็น บางแบบจำลองสร้างมาสำหรับข้อมูลนับ ขณะที่บางแบบจำลองเหมาะกับการวัดบนช่วงต่อเนื่อง
ลองทำเวอร์ชันของคุณเอง
ลองเลือกตัวแปรจากชีวิตประจำวัน 5 ตัว เช่น เบอร์รองเท้า รหัสไปรษณีย์ อุณหภูมิ จำนวนอีเมล หรือสีผม แล้วจำแนกแต่ละตัวแปร หากบางกรณีดูไม่ชัดเจน ให้ระบุเงื่อนไขที่ใช้ตัดสิน เช่น ค่านั้นเป็นป้ายกำกับ เป็นการนับ หรือเป็นการวัด
ถ้าคุณอยากลองต่ออีกขั้น ให้พิจารณาอีกกรณีหนึ่งโดยถามว่ากราฟหรือค่าสรุปแบบใดเหมาะกับตัวแปรแต่ละตัว และแบบใดไม่เหมาะ
ต้องการความช่วยเหลือในการแก้โจทย์?
อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที
เปิด GPAI Solver →