ANOVA ซึ่งย่อมาจาก analysis of variance เป็นวิธีทดสอบว่าค่าเฉลี่ยของผลลัพธ์แตกต่างกันระหว่างหลายกลุ่มหรือไม่ ใน one-way ANOVA เราจะเปรียบเทียบความแปรปรวนระหว่างค่าเฉลี่ยของกลุ่มกับความแปรปรวนภายในกลุ่ม ซึ่งให้ค่าสถิติ FF

โดยทั่วไป ANOVA เป็นเครื่องมือที่เหมาะเมื่อคุณมีตัวแปรจัดกลุ่มเชิงหมวดหมู่หนึ่งตัว มีตัวแปรตอบสนองเชิงปริมาณหนึ่งตัว และต้องการการทดสอบภาพรวมเพียงครั้งเดียวแทนการทำ tt-test แยกหลายครั้ง หากความแปรปรวนระหว่างกลุ่มมีขนาดใหญ่เมื่อเทียบกับความแปรปรวนภายในกลุ่ม นั่นเป็นหลักฐานว่าค่าเฉลี่ยประชากรไม่ได้เท่ากันทั้งหมด

สำหรับ one-way ANOVA แบบคลาสสิก สถิติทดสอบคือ

F=MSBMSWF = \frac{MS_B}{MS_W}

โดยที่ MSBMS_B คือค่า mean square ระหว่างกลุ่ม และ MSWMS_W คือค่า mean square ภายในกลุ่ม ค่า FF ที่มากขึ้นบ่งชี้ว่าค่าเฉลี่ยของกลุ่มแยกจากกันมากกว่าที่คาดจากความผันผวนปกติภายในกลุ่มเพียงอย่างเดียว

ANOVA ทดสอบอะไร

สมมติฐานศูนย์ตามปกติสำหรับ one-way ANOVA คือ

H0:μ1=μ2==μkH_0: \mu_1 = \mu_2 = \cdots = \mu_k

สมมติฐานทางเลือกไม่ได้หมายความว่า “ค่าเฉลี่ยทุกกลุ่มต่างกันทั้งหมด” แต่เป็นข้อความที่อ่อนกว่านั้น คือมีอย่างน้อยหนึ่งกลุ่มที่มีค่าเฉลี่ยแตกต่างจากอย่างน้อยอีกหนึ่งกลุ่ม

ประเด็นนี้สำคัญ เพราะ ANOVA เป็นการทดสอบภาพรวม ผลที่มีนัยสำคัญบอกเพียงว่ามีหลักฐานของความแตกต่างบางอย่างอยู่ที่ใดที่หนึ่ง แต่ไม่ได้ระบุว่ากลุ่มใดต่างจากกลุ่มใด ซึ่งมักต้องใช้การเปรียบเทียบต่อเนื่องภายหลัง

ทำไม ANOVA ใช้ความแปรปรวนเพื่อเปรียบเทียบค่าเฉลี่ย

ชื่อของมันอาจฟังดูย้อนแย้งในตอนแรก ถ้า ANOVA เกี่ยวกับค่าเฉลี่ย แล้วทำไมจึงใช้ความแปรปรวน?

เพราะความแปรปรวนเป็นวิธีที่ชัดเจนในการวัดการกระจายอยู่ 2 แบบ:

  1. การกระจายของค่าเฉลี่ยแต่ละกลุ่มรอบค่าเฉลี่ยรวม
  2. การกระจายของข้อมูลแต่ละตัวรอบค่าเฉลี่ยของกลุ่มตัวเอง

ถ้าการกระจายแบบแรกใหญ่กว่าแบบที่สองมาก กลุ่มต่าง ๆ จะดูแยกจากกันมากกว่าที่ความผันผวนปกติภายในกลุ่มมักจะก่อให้เกิด

เมื่อใดที่ One-Way ANOVA เหมาะสม

One-way ANOVA ใช้เมื่อมีปัจจัยเชิงหมวดหมู่หนึ่งตัวแบ่งข้อมูลออกเป็นหลายกลุ่ม และคุณต้องการเปรียบเทียบค่าเฉลี่ยของตัวแปรตอบสนองเชิงปริมาณหนึ่งตัวระหว่างกลุ่มเหล่านั้น

ตัวอย่างเช่น การเปรียบเทียบคะแนนสอบเฉลี่ยระหว่างวิธีการสอน การเปรียบเทียบผลผลิตพืชเฉลี่ยระหว่างปุ๋ยชนิดต่าง ๆ หรือการเปรียบเทียบเวลาในการตอบสนองเฉลี่ยระหว่างเงื่อนไขการทดลอง

สำหรับ one-way ANOVA แบบคลาสสิก สมมติฐานหลักมีดังนี้:

  1. ข้อมูลสังเกตเป็นอิสระต่อกัน
  2. ตัวแปรตอบสนองวัดในสเกลเชิงปริมาณ
  3. ความแปรปรวนของแต่ละกลุ่มใกล้เคียงกันพอสมควร
  4. แบบจำลองไม่ขัดกับลักษณะของข้อมูลมากเกินไป โดยเฉพาะเมื่อขนาดตัวอย่างเล็ก

ANOVA ยังอาจมีความทนทานต่อการละเมิดสมมติฐานได้พอสมควรในหลายสถานการณ์ โดยเฉพาะเมื่อกลุ่มมีขนาดสมดุลและขนาดตัวอย่างปานกลาง แต่ทั้งนี้ขึ้นอยู่กับการออกแบบการศึกษา หากข้อมูลเป็นแบบจับคู่ วัดซ้ำในบุคคลเดิม หรือมีความแปรปรวนไม่เท่ากันอย่างมาก one-way ANOVA แบบปกติอาจไม่ใช่เครื่องมือที่เหมาะ

ตัวอย่าง One-Way ANOVA

สมมติว่าครูคนหนึ่งต้องการเปรียบเทียบวิธีการอ่านหนังสือ 3 วิธีโดยใช้คะแนนควิซ:

  1. วิธี A: 7272, 7474, 7676
  2. วิธี B: 7878, 8080, 8282
  3. วิธี C: 8484, 8686, 8888

ค่าเฉลี่ยของแต่ละกลุ่มคือ

xˉA=74,xˉB=80,xˉC=86\bar{x}_A = 74, \qquad \bar{x}_B = 80, \qquad \bar{x}_C = 86

ค่าเฉลี่ยรวมของคะแนนทั้ง 99 ค่า คือ

xˉ=80\bar{x} = 80

ตอนนี้แยกความแปรปรวนออกเป็น 2 ส่วน

ขั้นที่ 1: ความแปรปรวนระหว่างกลุ่ม

แต่ละกลุ่มมีข้อมูล 33 ค่า ดังนั้นผลรวมกำลังสองระหว่างกลุ่มคือ

SSB=3(7480)2+3(8080)2+3(8680)2SS_B = 3(74-80)^2 + 3(80-80)^2 + 3(86-80)^2 SSB=3(36)+0+3(36)=216SS_B = 3(36) + 0 + 3(36) = 216

เมื่อมี k=3k=3 กลุ่ม องศาอิสระระหว่างกลุ่มคือ k1=2k-1=2 ดังนั้น

MSB=SSBk1=2162=108MS_B = \frac{SS_B}{k-1} = \frac{216}{2} = 108

ขั้นที่ 2: ความแปรปรวนภายในกลุ่ม

ภายในแต่ละกลุ่ม คะแนนแต่ละค่าห่างจากค่าเฉลี่ยของกลุ่มเพียง 22 คะแนนในแต่ละด้าน:

SSW=(4+0+4)+(4+0+4)+(4+0+4)=24SS_W = (4+0+4) + (4+0+4) + (4+0+4) = 24

เมื่อมีข้อมูลทั้งหมด N=9N=9 ค่า องศาอิสระภายในกลุ่มคือ Nk=6N-k=6 ดังนั้น

MSW=SSWNk=246=4MS_W = \frac{SS_W}{N-k} = \frac{24}{6} = 4

ขั้นที่ 3: คำนวณค่าสถิติ FF

ตอนนี้คำนวณ

F=MSBMSW=1084=27F = \frac{MS_B}{MS_W} = \frac{108}{4} = 27

ค่า FF ที่สูงขนาดนี้หมายความว่าค่าเฉลี่ยของกลุ่มอยู่ห่างกันมากเมื่อเทียบกับความแปรปรวนภายในกลุ่ม ภายใต้สมมติฐานปกติของ one-way ANOVA นี่เป็นหลักฐานที่แรงต่อสมมติฐานศูนย์ที่ว่าค่าเฉลี่ยประชากรทั้งสามเท่ากัน

การตีความในทางปฏิบัตินั้นง่ายมาก: ความแตกต่างระหว่างวิธีการอ่านหนังสือทั้งสามมีขนาดใหญ่เกินกว่าจะอธิบายว่าเป็นเพียงการกระจายตัวปกติภายในกลุ่มเท่านั้น

สิ่งที่ ANOVA ไม่ได้บอกคุณ

ANOVA ไม่ได้บอกว่าคู่ของกลุ่มใดแตกต่างกันโดยเฉพาะ หลังจากได้ผลภาพรวมที่มีนัยสำคัญแล้ว โดยทั่วไปคุณจะต้องใช้การเปรียบเทียบหลังการทดสอบ (post-hoc) หรือ planned contrasts

นอกจากนี้ ANOVA ก็ไม่ได้บอกว่าผลที่พบมีความสำคัญในเชิงปฏิบัติจริงหรือไม่ ความแตกต่างที่ตรวจพบได้ทางสถิติอาจยังเล็กเกินกว่าจะมีความหมายในสถานการณ์จริง

หากการศึกษาไม่ได้สุ่มตัวอย่างหรือสุ่มจัดกลุ่ม ANOVA ก็ไม่ได้พิสูจน์ว่าตัวแปรจัดกลุ่มเป็นสาเหตุของความแตกต่าง มันเพียงทดสอบว่าค่าเฉลี่ยของกลุ่มดูแตกต่างกันหรือไม่ในข้อมูลที่คุณเก็บมา

ข้อผิดพลาดที่พบบ่อยเกี่ยวกับ ANOVA

ความเข้าใจผิดอย่างหนึ่งคือคิดว่า ANOVA เป็นการทดสอบหลักว่าความแปรปรวนของแต่ละกลุ่มเท่ากันหรือไม่ ในการใช้งานมาตรฐาน ANOVA ใช้เปรียบเทียบค่าเฉลี่ย ความแปรปรวนปรากฏอยู่เพราะมันเป็นกลไกที่ใช้วัดสัญญาณเทียบกับสัญญาณรบกวน

อีกข้อผิดพลาดหนึ่งคือทำ tt-test แยกหลายครั้งแทนที่จะทำ ANOVA แบบภาพรวมเพียงครั้งเดียวเมื่อมีหลายกลุ่มเข้ามาเกี่ยวข้อง วิธีนั้นอาจเพิ่มความเสี่ยงของการพบผลบวกลวง เว้นแต่จะมีการปรับการเปรียบเทียบอย่างระมัดระวัง

ข้อผิดพลาดข้อที่สามคือหยุดแค่ผล ANOVA มีนัยสำคัญแล้วอ้างว่ารู้แน่ชัดว่ากลุ่มใดดีที่สุด การทดสอบภาพรวมเพียงอย่างเดียวไม่สามารถตอบคำถามนั้นได้

ANOVA ใช้ที่ไหนบ้าง

ANOVA พบได้บ่อยในงานทดลอง การทดสอบผลิตภัณฑ์ การศึกษา ชีววิทยา เกษตรกรรม และสังคมศาสตร์ มันมีประโยชน์ทุกครั้งที่คุณต้องการการทดสอบเดียวที่น่าเชื่อถือสำหรับความแตกต่างของค่าเฉลี่ยระหว่างหลายกลุ่ม

มันมีประโยชน์เป็นพิเศษเมื่อคำถามที่แท้จริงเป็นคำถามเชิงเปรียบเทียบ: การรักษา วิธีการ หรือเงื่อนไขเหล่านี้ให้ผลลัพธ์เฉลี่ยที่แตกต่างกันอย่างวัดได้หรือไม่

ลองทำเวอร์ชันของคุณเอง

ใช้ตัวอย่างเดิมแล้วเปลี่ยนวิธี B เป็น 7979, 8080, 8181 จากนั้นคำนวณ SSWSS_W, MSWMS_W และค่าสถิติ FF สุดท้ายใหม่ การเปลี่ยนแปลงเพียงจุดเดียวนี้ทำให้เห็นแนวคิดหลักได้ชัดเจน: เมื่อสัญญาณรบกวนภายในกลุ่มเพิ่มขึ้น หลักฐานที่สนับสนุนว่ามีความแตกต่างของค่าเฉลี่ยจริงจะอ่อนลง

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →