การทดสอบไคสแควร์

การทดสอบไคสแควร์ใช้ตรวจว่าข้อมูลนับแบบจัดเป็นหมวดหมู่แตกต่างจากสิ่งที่แบบจำลองคาดไว้จากความบังเอิญเพียงอย่างเดียวมากเกินไปหรือไม่ การทดสอบนี้ใช้กับจำนวนในแต่ละหมวดหมู่ ไม่ได้ใช้กับค่าเฉลี่ยหรือค่าการวัดดิบ

แนวคิดหลักนั้นง่ายมาก: เปรียบเทียบสิ่งที่สังเกตได้กับสิ่งที่คาดว่าจะเกิดขึ้นถ้าสมมติฐานศูนย์เป็นจริง หากความต่างมีขนาดใหญ่พอ ค่าสถิติไคสแควร์ก็จะมีค่าสูง และข้อมูลนั้นจะนับเป็นหลักฐานที่ขัดกับแบบจำลองภายใต้สมมติฐานศูนย์

การทดสอบนี้กำลังเปรียบเทียบอะไรจริง ๆ

ในรูปแบบที่พบบ่อยที่สุด คุณจะมีจำนวนที่สังเกตได้ $O$ และจำนวนที่คาดหมาย $E$ สำหรับแต่ละหมวดหมู่ ค่าสถิติคือ

\chi^2 = \sum \frac{(O - E)^2}{E}

ค่านี้จะมากขึ้นเมื่อจำนวนที่สังเกตได้เบี่ยงออกจากจำนวนที่คาดหมายมากขึ้น ความคลาดเคลื่อนที่มากกว่าจะมีผลมากกว่า และหมวดหมู่ที่มีจำนวนคาดหมายมากกว่าจะถูกปรับสเกลให้เหมาะสมตามสูตร

จำนวนที่คาดหมายไม่ได้เดาแบบคร่าว ๆ แต่มาจากสมมติฐานศูนย์ สำหรับการทดสอบความสอดคล้อง สมมติฐานศูนย์อาจระบุว่าทุกหมวดหมู่ควรมีโอกาสเกิดเท่ากัน ส่วนการทดสอบความเป็นอิสระ สมมติฐานศูนย์ระบุว่าตัวแปรเชิงหมวดหมู่สองตัวไม่เกี่ยวข้องกัน

สองรูปแบบที่พบบ่อย

คำว่า "การทดสอบไคสแควร์" มักหมายถึงอย่างใดอย่างหนึ่งต่อไปนี้:

การทดสอบความสอดคล้อง (goodness-of-fit) ซึ่งถามว่าตัวแปรเชิงหมวดหมู่หนึ่งตัวเป็นไปตามการแจกแจงที่อ้างไว้หรือไม่
การทดสอบความเป็นอิสระ (test of independence) ซึ่งถามว่าตัวแปรเชิงหมวดหมู่สองตัวมีความสัมพันธ์กันหรือไม่ในตารางไขว้

ทั้งสองกรณีใช้ตระกูลค่าสถิติเดียวกัน แต่การคำนวณจำนวนที่คาดหมายจะขึ้นอยู่กับว่าเป็นรูปแบบใด

ตัวอย่างคำนวณ: การทดสอบความสอดคล้อง

สมมติว่าร้านกาแฟต้องการรู้ว่าขนาดเครื่องดื่มสามขนาดถูกเลือกบ่อยเท่ากันหรือไม่ จากคำสั่งซื้อ $60$ รายการ จำนวนที่สังเกตได้คือ:

เล็ก: $26$
กลาง: $18$
ใหญ่: $16$

ถ้าสมมติฐานศูนย์ระบุว่าทั้งสามขนาดมีโอกาสถูกเลือกเท่ากัน จำนวนที่คาดหมายในแต่ละหมวดหมู่คือ

E = \frac{60}{3} = 20

จากนั้นคำนวณค่าสถิติ:

\chi^2 = \frac{(26-20)^2}{20} + \frac{(18-20)^2}{20} + \frac{(16-20)^2}{20}

= \frac{36}{20} + \frac{4}{20} + \frac{16}{20}

= 1.8 + 0.2 + 0.8 = 2.8

นี่คือค่าสถิติทดสอบ แต่ยังไม่ใช่ข้อสรุปสุดท้ายในตัวมันเอง คุณต้องนำ $\chi^2 = 2.8$ ไปเปรียบเทียบกับการแจกแจงไคสแควร์ที่มีองศาอิสระเหมาะสม ในที่นี้องศาอิสระคือ $3 - 1 = 2$ เพราะมีสามหมวดหมู่และไม่มีการประมาณพารามิเตอร์จากข้อมูล เมื่อ $df = 2$ ค่าสถิติ $2.8$ ยังไม่ใช่หลักฐานที่แรงพอจะโต้แย้งความชอบที่เท่ากันที่ระดับ $5\%$

การตีความในทางปฏิบัติคือ: จำนวนที่นับได้ต่างจากความเท่ากันแบบสมบูรณ์ แต่ยังไม่มากพอที่จะสรุปอย่างมั่นใจว่าความชอบที่แท้จริงไม่เท่ากัน โดยอาศัยตัวอย่างนี้เพียงอย่างเดียว

เมื่อใดที่การทดสอบนี้เหมาะสม

ใช้การทดสอบไคสแควร์เมื่อเงื่อนไขทั้งหมดต่อไปนี้เป็นจริง:

ข้อมูลของคุณเป็นจำนวนที่นับได้ในแต่ละหมวดหมู่
ข้อมูลสังเกตแต่ละรายการเป็นอิสระต่อกัน หรือใกล้เคียงพอสำหรับแบบจำลองที่คุณใช้
จำนวนที่คาดหมายไม่เล็กเกินไปสำหรับการประมาณแบบไคสแควร์ที่คุณตั้งใจใช้

ในบทเรียนเบื้องต้นหลายแห่ง มักใช้กฎคร่าว ๆ ว่าจำนวนที่คาดหมายควรมีอย่างน้อยประมาณ $5$ ในแต่ละหมวดหมู่ นี่เป็นแนวทางเชิงปฏิบัติ ไม่ใช่กฎตายตัวสากล แต่เป็นสัญญาณเตือนที่มีประโยชน์

ข้อผิดพลาดที่พบบ่อย

ใช้การทดสอบนี้กับค่าเฉลี่ย ค่าการวัด หรือเปอร์เซ็นต์ แทนที่จะใช้กับจำนวนในหมวดหมู่
ถือว่าจำนวนที่สังเกตได้คือจำนวนที่คาดหมาย จำนวนที่คาดหมายต้องมาจากสมมติฐานศูนย์
มองข้ามจำนวนที่คาดหมายขนาดเล็ก ซึ่งอาจทำให้การประมาณแบบไคสแควร์ตามปกติไม่น่าเชื่อถือ
คิดว่า "มีนัยสำคัญทางสถิติ" แปลว่า "สำคัญในทางปฏิบัติ" ทั้งที่การทดสอบนี้บอกเพียงว่ามีหลักฐานขัดกับแบบจำลองภายใต้สมมติฐานศูนย์หรือไม่

พบการทดสอบนี้ได้ที่ไหน

การทดสอบไคสแควร์พบได้ในงานสำรวจ พันธุศาสตร์ การควบคุมคุณภาพ การวิจัยตลาด และทุกสถานการณ์ที่ผลลัพธ์ถูกจัดเป็นหมวดหมู่ โดยเฉพาะเมื่อคำถามจริงคือ รูปแบบที่เห็นนั้นน่าประหลาดใจหรือไม่ หรือ ตัวแปรเชิงหมวดหมู่สองตัวดูเหมือนจะเกี่ยวข้องกันหรือไม่

ถ้าข้อมูลเป็นเชิงตัวเลขแทนที่จะเป็นเชิงหมวดหมู่ เครื่องมืออื่นมักจะเหมาะกว่า ตัวอย่างเช่น การเปรียบเทียบค่าเฉลี่ยมักนำไปสู่การใช้การทดสอบ $t$ หรือ ANOVA แทน

ลองทำในแบบของคุณเอง

ลองนำตารางจำนวนในแต่ละหมวดหมู่ขนาดเล็กมาสักตาราง แล้วเขียนสมมติฐานศูนย์ก่อนเริ่มคำนวณ ขั้นตอนเดียวนี้มักช่วยป้องกันความผิดพลาดที่ใหญ่ที่สุดในโจทย์ไคสแควร์ได้ นั่นคือใช้สูตรถูก แต่ใช้จำนวนที่คาดหมายผิด

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →