การทดสอบไคสแควร์ใช้ตรวจว่าข้อมูลนับแบบจัดเป็นหมวดหมู่แตกต่างจากสิ่งที่แบบจำลองคาดไว้จากความบังเอิญเพียงอย่างเดียวมากเกินไปหรือไม่ การทดสอบนี้ใช้กับจำนวนในแต่ละหมวดหมู่ ไม่ได้ใช้กับค่าเฉลี่ยหรือค่าการวัดดิบ
แนวคิดหลักนั้นง่ายมาก: เปรียบเทียบสิ่งที่สังเกตได้กับสิ่งที่คาดว่าจะเกิดขึ้นถ้าสมมติฐานศูนย์เป็นจริง หากความต่างมีขนาดใหญ่พอ ค่าสถิติไคสแควร์ก็จะมีค่าสูง และข้อมูลนั้นจะนับเป็นหลักฐานที่ขัดกับแบบจำลองภายใต้สมมติฐานศูนย์
การทดสอบนี้กำลังเปรียบเทียบอะไรจริง ๆ
ในรูปแบบที่พบบ่อยที่สุด คุณจะมีจำนวนที่สังเกตได้ และจำนวนที่คาดหมาย สำหรับแต่ละหมวดหมู่ ค่าสถิติคือ
ค่านี้จะมากขึ้นเมื่อจำนวนที่สังเกตได้เบี่ยงออกจากจำนวนที่คาดหมายมากขึ้น ความคลาดเคลื่อนที่มากกว่าจะมีผลมากกว่า และหมวดหมู่ที่มีจำนวนคาดหมายมากกว่าจะถูกปรับสเกลให้เหมาะสมตามสูตร
จำนวนที่คาดหมายไม่ได้เดาแบบคร่าว ๆ แต่มาจากสมมติฐานศูนย์ สำหรับการทดสอบความสอดคล้อง สมมติฐานศูนย์อาจระบุว่าทุกหมวดหมู่ควรมีโอกาสเกิดเท่ากัน ส่วนการทดสอบความเป็นอิสระ สมมติฐานศูนย์ระบุว่าตัวแปรเชิงหมวดหมู่สองตัวไม่เกี่ยวข้องกัน
สองรูปแบบที่พบบ่อย
คำว่า "การทดสอบไคสแควร์" มักหมายถึงอย่างใดอย่างหนึ่งต่อไปนี้:
- การทดสอบความสอดคล้อง (goodness-of-fit) ซึ่งถามว่าตัวแปรเชิงหมวดหมู่หนึ่งตัวเป็นไปตามการแจกแจงที่อ้างไว้หรือไม่
- การทดสอบความเป็นอิสระ (test of independence) ซึ่งถามว่าตัวแปรเชิงหมวดหมู่สองตัวมีความสัมพันธ์กันหรือไม่ในตารางไขว้
ทั้งสองกรณีใช้ตระกูลค่าสถิติเดียวกัน แต่การคำนวณจำนวนที่คาดหมายจะขึ้นอยู่กับว่าเป็นรูปแบบใด
ตัวอย่างคำนวณ: การทดสอบความสอดคล้อง
สมมติว่าร้านกาแฟต้องการรู้ว่าขนาดเครื่องดื่มสามขนาดถูกเลือกบ่อยเท่ากันหรือไม่ จากคำสั่งซื้อ รายการ จำนวนที่สังเกตได้คือ:
- เล็ก:
- กลาง:
- ใหญ่:
ถ้าสมมติฐานศูนย์ระบุว่าทั้งสามขนาดมีโอกาสถูกเลือกเท่ากัน จำนวนที่คาดหมายในแต่ละหมวดหมู่คือ
จากนั้นคำนวณค่าสถิติ:
นี่คือค่าสถิติทดสอบ แต่ยังไม่ใช่ข้อสรุปสุดท้ายในตัวมันเอง คุณต้องนำ ไปเปรียบเทียบกับการแจกแจงไคสแควร์ที่มีองศาอิสระเหมาะสม ในที่นี้องศาอิสระคือ เพราะมีสามหมวดหมู่และไม่มีการประมาณพารามิเตอร์จากข้อมูล เมื่อ ค่าสถิติ ยังไม่ใช่หลักฐานที่แรงพอจะโต้แย้งความชอบที่เท่ากันที่ระดับ
การตีความในทางปฏิบัติคือ: จำนวนที่นับได้ต่างจากความเท่ากันแบบสมบูรณ์ แต่ยังไม่มากพอที่จะสรุปอย่างมั่นใจว่าความชอบที่แท้จริงไม่เท่ากัน โดยอาศัยตัวอย่างนี้เพียงอย่างเดียว
เมื่อใดที่การทดสอบนี้เหมาะสม
ใช้การทดสอบไคสแควร์เมื่อเงื่อนไขทั้งหมดต่อไปนี้เป็นจริง:
- ข้อมูลของคุณเป็นจำนวนที่นับได้ในแต่ละหมวดหมู่
- ข้อมูลสังเกตแต่ละรายการเป็นอิสระต่อกัน หรือใกล้เคียงพอสำหรับแบบจำลองที่คุณใช้
- จำนวนที่คาดหมายไม่เล็กเกินไปสำหรับการประมาณแบบไคสแควร์ที่คุณตั้งใจใช้
ในบทเรียนเบื้องต้นหลายแห่ง มักใช้กฎคร่าว ๆ ว่าจำนวนที่คาดหมายควรมีอย่างน้อยประมาณ ในแต่ละหมวดหมู่ นี่เป็นแนวทางเชิงปฏิบัติ ไม่ใช่กฎตายตัวสากล แต่เป็นสัญญาณเตือนที่มีประโยชน์
ข้อผิดพลาดที่พบบ่อย
- ใช้การทดสอบนี้กับค่าเฉลี่ย ค่าการวัด หรือเปอร์เซ็นต์ แทนที่จะใช้กับจำนวนในหมวดหมู่
- ถือว่าจำนวนที่สังเกตได้คือจำนวนที่คาดหมาย จำนวนที่คาดหมายต้องมาจากสมมติฐานศูนย์
- มองข้ามจำนวนที่คาดหมายขนาดเล็ก ซึ่งอาจทำให้การประมาณแบบไคสแควร์ตามปกติไม่น่าเชื่อถือ
- คิดว่า "มีนัยสำคัญทางสถิติ" แปลว่า "สำคัญในทางปฏิบัติ" ทั้งที่การทดสอบนี้บอกเพียงว่ามีหลักฐานขัดกับแบบจำลองภายใต้สมมติฐานศูนย์หรือไม่
พบการทดสอบนี้ได้ที่ไหน
การทดสอบไคสแควร์พบได้ในงานสำรวจ พันธุศาสตร์ การควบคุมคุณภาพ การวิจัยตลาด และทุกสถานการณ์ที่ผลลัพธ์ถูกจัดเป็นหมวดหมู่ โดยเฉพาะเมื่อคำถามจริงคือ รูปแบบที่เห็นนั้นน่าประหลาดใจหรือไม่ หรือ ตัวแปรเชิงหมวดหมู่สองตัวดูเหมือนจะเกี่ยวข้องกันหรือไม่
ถ้าข้อมูลเป็นเชิงตัวเลขแทนที่จะเป็นเชิงหมวดหมู่ เครื่องมืออื่นมักจะเหมาะกว่า ตัวอย่างเช่น การเปรียบเทียบค่าเฉลี่ยมักนำไปสู่การใช้การทดสอบ หรือ ANOVA แทน
ลองทำในแบบของคุณเอง
ลองนำตารางจำนวนในแต่ละหมวดหมู่ขนาดเล็กมาสักตาราง แล้วเขียนสมมติฐานศูนย์ก่อนเริ่มคำนวณ ขั้นตอนเดียวนี้มักช่วยป้องกันความผิดพลาดที่ใหญ่ที่สุดในโจทย์ไคสแควร์ได้ นั่นคือใช้สูตรถูก แต่ใช้จำนวนที่คาดหมายผิด
ต้องการความช่วยเหลือในการแก้โจทย์?
อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที
เปิด GPAI Solver →