การทดสอบไคสแควร์ใช้ตรวจว่าข้อมูลนับแบบจัดเป็นหมวดหมู่แตกต่างจากสิ่งที่แบบจำลองคาดไว้จากความบังเอิญเพียงอย่างเดียวมากเกินไปหรือไม่ การทดสอบนี้ใช้กับจำนวนในแต่ละหมวดหมู่ ไม่ได้ใช้กับค่าเฉลี่ยหรือค่าการวัดดิบ

แนวคิดหลักนั้นง่ายมาก: เปรียบเทียบสิ่งที่สังเกตได้กับสิ่งที่คาดว่าจะเกิดขึ้นถ้าสมมติฐานศูนย์เป็นจริง หากความต่างมีขนาดใหญ่พอ ค่าสถิติไคสแควร์ก็จะมีค่าสูง และข้อมูลนั้นจะนับเป็นหลักฐานที่ขัดกับแบบจำลองภายใต้สมมติฐานศูนย์

การทดสอบนี้กำลังเปรียบเทียบอะไรจริง ๆ

ในรูปแบบที่พบบ่อยที่สุด คุณจะมีจำนวนที่สังเกตได้ OO และจำนวนที่คาดหมาย EE สำหรับแต่ละหมวดหมู่ ค่าสถิติคือ

χ2=(OE)2E\chi^2 = \sum \frac{(O - E)^2}{E}

ค่านี้จะมากขึ้นเมื่อจำนวนที่สังเกตได้เบี่ยงออกจากจำนวนที่คาดหมายมากขึ้น ความคลาดเคลื่อนที่มากกว่าจะมีผลมากกว่า และหมวดหมู่ที่มีจำนวนคาดหมายมากกว่าจะถูกปรับสเกลให้เหมาะสมตามสูตร

จำนวนที่คาดหมายไม่ได้เดาแบบคร่าว ๆ แต่มาจากสมมติฐานศูนย์ สำหรับการทดสอบความสอดคล้อง สมมติฐานศูนย์อาจระบุว่าทุกหมวดหมู่ควรมีโอกาสเกิดเท่ากัน ส่วนการทดสอบความเป็นอิสระ สมมติฐานศูนย์ระบุว่าตัวแปรเชิงหมวดหมู่สองตัวไม่เกี่ยวข้องกัน

สองรูปแบบที่พบบ่อย

คำว่า "การทดสอบไคสแควร์" มักหมายถึงอย่างใดอย่างหนึ่งต่อไปนี้:

  1. การทดสอบความสอดคล้อง (goodness-of-fit) ซึ่งถามว่าตัวแปรเชิงหมวดหมู่หนึ่งตัวเป็นไปตามการแจกแจงที่อ้างไว้หรือไม่
  2. การทดสอบความเป็นอิสระ (test of independence) ซึ่งถามว่าตัวแปรเชิงหมวดหมู่สองตัวมีความสัมพันธ์กันหรือไม่ในตารางไขว้

ทั้งสองกรณีใช้ตระกูลค่าสถิติเดียวกัน แต่การคำนวณจำนวนที่คาดหมายจะขึ้นอยู่กับว่าเป็นรูปแบบใด

ตัวอย่างคำนวณ: การทดสอบความสอดคล้อง

สมมติว่าร้านกาแฟต้องการรู้ว่าขนาดเครื่องดื่มสามขนาดถูกเลือกบ่อยเท่ากันหรือไม่ จากคำสั่งซื้อ 6060 รายการ จำนวนที่สังเกตได้คือ:

  • เล็ก: 2626
  • กลาง: 1818
  • ใหญ่: 1616

ถ้าสมมติฐานศูนย์ระบุว่าทั้งสามขนาดมีโอกาสถูกเลือกเท่ากัน จำนวนที่คาดหมายในแต่ละหมวดหมู่คือ

E=603=20E = \frac{60}{3} = 20

จากนั้นคำนวณค่าสถิติ:

χ2=(2620)220+(1820)220+(1620)220\chi^2 = \frac{(26-20)^2}{20} + \frac{(18-20)^2}{20} + \frac{(16-20)^2}{20} =3620+420+1620= \frac{36}{20} + \frac{4}{20} + \frac{16}{20} =1.8+0.2+0.8=2.8= 1.8 + 0.2 + 0.8 = 2.8

นี่คือค่าสถิติทดสอบ แต่ยังไม่ใช่ข้อสรุปสุดท้ายในตัวมันเอง คุณต้องนำ χ2=2.8\chi^2 = 2.8 ไปเปรียบเทียบกับการแจกแจงไคสแควร์ที่มีองศาอิสระเหมาะสม ในที่นี้องศาอิสระคือ 31=23 - 1 = 2 เพราะมีสามหมวดหมู่และไม่มีการประมาณพารามิเตอร์จากข้อมูล เมื่อ df=2df = 2 ค่าสถิติ 2.82.8 ยังไม่ใช่หลักฐานที่แรงพอจะโต้แย้งความชอบที่เท่ากันที่ระดับ 5%5\%

การตีความในทางปฏิบัติคือ: จำนวนที่นับได้ต่างจากความเท่ากันแบบสมบูรณ์ แต่ยังไม่มากพอที่จะสรุปอย่างมั่นใจว่าความชอบที่แท้จริงไม่เท่ากัน โดยอาศัยตัวอย่างนี้เพียงอย่างเดียว

เมื่อใดที่การทดสอบนี้เหมาะสม

ใช้การทดสอบไคสแควร์เมื่อเงื่อนไขทั้งหมดต่อไปนี้เป็นจริง:

  1. ข้อมูลของคุณเป็นจำนวนที่นับได้ในแต่ละหมวดหมู่
  2. ข้อมูลสังเกตแต่ละรายการเป็นอิสระต่อกัน หรือใกล้เคียงพอสำหรับแบบจำลองที่คุณใช้
  3. จำนวนที่คาดหมายไม่เล็กเกินไปสำหรับการประมาณแบบไคสแควร์ที่คุณตั้งใจใช้

ในบทเรียนเบื้องต้นหลายแห่ง มักใช้กฎคร่าว ๆ ว่าจำนวนที่คาดหมายควรมีอย่างน้อยประมาณ 55 ในแต่ละหมวดหมู่ นี่เป็นแนวทางเชิงปฏิบัติ ไม่ใช่กฎตายตัวสากล แต่เป็นสัญญาณเตือนที่มีประโยชน์

ข้อผิดพลาดที่พบบ่อย

  1. ใช้การทดสอบนี้กับค่าเฉลี่ย ค่าการวัด หรือเปอร์เซ็นต์ แทนที่จะใช้กับจำนวนในหมวดหมู่
  2. ถือว่าจำนวนที่สังเกตได้คือจำนวนที่คาดหมาย จำนวนที่คาดหมายต้องมาจากสมมติฐานศูนย์
  3. มองข้ามจำนวนที่คาดหมายขนาดเล็ก ซึ่งอาจทำให้การประมาณแบบไคสแควร์ตามปกติไม่น่าเชื่อถือ
  4. คิดว่า "มีนัยสำคัญทางสถิติ" แปลว่า "สำคัญในทางปฏิบัติ" ทั้งที่การทดสอบนี้บอกเพียงว่ามีหลักฐานขัดกับแบบจำลองภายใต้สมมติฐานศูนย์หรือไม่

พบการทดสอบนี้ได้ที่ไหน

การทดสอบไคสแควร์พบได้ในงานสำรวจ พันธุศาสตร์ การควบคุมคุณภาพ การวิจัยตลาด และทุกสถานการณ์ที่ผลลัพธ์ถูกจัดเป็นหมวดหมู่ โดยเฉพาะเมื่อคำถามจริงคือ รูปแบบที่เห็นนั้นน่าประหลาดใจหรือไม่ หรือ ตัวแปรเชิงหมวดหมู่สองตัวดูเหมือนจะเกี่ยวข้องกันหรือไม่

ถ้าข้อมูลเป็นเชิงตัวเลขแทนที่จะเป็นเชิงหมวดหมู่ เครื่องมืออื่นมักจะเหมาะกว่า ตัวอย่างเช่น การเปรียบเทียบค่าเฉลี่ยมักนำไปสู่การใช้การทดสอบ tt หรือ ANOVA แทน

ลองทำในแบบของคุณเอง

ลองนำตารางจำนวนในแต่ละหมวดหมู่ขนาดเล็กมาสักตาราง แล้วเขียนสมมติฐานศูนย์ก่อนเริ่มคำนวณ ขั้นตอนเดียวนี้มักช่วยป้องกันความผิดพลาดที่ใหญ่ที่สุดในโจทย์ไคสแควร์ได้ นั่นคือใช้สูตรถูก แต่ใช้จำนวนที่คาดหมายผิด

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →