ANOVA — อธิบายการวิเคราะห์ความแปรปรวน

ANOVA ซึ่งย่อมาจาก analysis of variance เป็นวิธีทดสอบว่าค่าเฉลี่ยของผลลัพธ์แตกต่างกันระหว่างหลายกลุ่มหรือไม่ ใน one-way ANOVA เราจะเปรียบเทียบความแปรปรวนระหว่างค่าเฉลี่ยของกลุ่มกับความแปรปรวนภายในกลุ่ม ซึ่งให้ค่าสถิติ $F$

โดยทั่วไป ANOVA เป็นเครื่องมือที่เหมาะเมื่อคุณมีตัวแปรจัดกลุ่มเชิงหมวดหมู่หนึ่งตัว มีตัวแปรตอบสนองเชิงปริมาณหนึ่งตัว และต้องการการทดสอบภาพรวมเพียงครั้งเดียวแทนการทำ $t$ -test แยกหลายครั้ง หากความแปรปรวนระหว่างกลุ่มมีขนาดใหญ่เมื่อเทียบกับความแปรปรวนภายในกลุ่ม นั่นเป็นหลักฐานว่าค่าเฉลี่ยประชากรไม่ได้เท่ากันทั้งหมด

สำหรับ one-way ANOVA แบบคลาสสิก สถิติทดสอบคือ

F = \frac{MS_B}{MS_W}

โดยที่ $MS_B$ คือค่า mean square ระหว่างกลุ่ม และ $MS_W$ คือค่า mean square ภายในกลุ่ม ค่า $F$ ที่มากขึ้นบ่งชี้ว่าค่าเฉลี่ยของกลุ่มแยกจากกันมากกว่าที่คาดจากความผันผวนปกติภายในกลุ่มเพียงอย่างเดียว

ANOVA ทดสอบอะไร

สมมติฐานศูนย์ตามปกติสำหรับ one-way ANOVA คือ

H_0: \mu_1 = \mu_2 = \cdots = \mu_k

สมมติฐานทางเลือกไม่ได้หมายความว่า “ค่าเฉลี่ยทุกกลุ่มต่างกันทั้งหมด” แต่เป็นข้อความที่อ่อนกว่านั้น คือมีอย่างน้อยหนึ่งกลุ่มที่มีค่าเฉลี่ยแตกต่างจากอย่างน้อยอีกหนึ่งกลุ่ม

ประเด็นนี้สำคัญ เพราะ ANOVA เป็นการทดสอบภาพรวม ผลที่มีนัยสำคัญบอกเพียงว่ามีหลักฐานของความแตกต่างบางอย่างอยู่ที่ใดที่หนึ่ง แต่ไม่ได้ระบุว่ากลุ่มใดต่างจากกลุ่มใด ซึ่งมักต้องใช้การเปรียบเทียบต่อเนื่องภายหลัง

ทำไม ANOVA ใช้ความแปรปรวนเพื่อเปรียบเทียบค่าเฉลี่ย

ชื่อของมันอาจฟังดูย้อนแย้งในตอนแรก ถ้า ANOVA เกี่ยวกับค่าเฉลี่ย แล้วทำไมจึงใช้ความแปรปรวน?

เพราะความแปรปรวนเป็นวิธีที่ชัดเจนในการวัดการกระจายอยู่ 2 แบบ:

การกระจายของค่าเฉลี่ยแต่ละกลุ่มรอบค่าเฉลี่ยรวม
การกระจายของข้อมูลแต่ละตัวรอบค่าเฉลี่ยของกลุ่มตัวเอง

ถ้าการกระจายแบบแรกใหญ่กว่าแบบที่สองมาก กลุ่มต่าง ๆ จะดูแยกจากกันมากกว่าที่ความผันผวนปกติภายในกลุ่มมักจะก่อให้เกิด

เมื่อใดที่ One-Way ANOVA เหมาะสม

One-way ANOVA ใช้เมื่อมีปัจจัยเชิงหมวดหมู่หนึ่งตัวแบ่งข้อมูลออกเป็นหลายกลุ่ม และคุณต้องการเปรียบเทียบค่าเฉลี่ยของตัวแปรตอบสนองเชิงปริมาณหนึ่งตัวระหว่างกลุ่มเหล่านั้น

ตัวอย่างเช่น การเปรียบเทียบคะแนนสอบเฉลี่ยระหว่างวิธีการสอน การเปรียบเทียบผลผลิตพืชเฉลี่ยระหว่างปุ๋ยชนิดต่าง ๆ หรือการเปรียบเทียบเวลาในการตอบสนองเฉลี่ยระหว่างเงื่อนไขการทดลอง

สำหรับ one-way ANOVA แบบคลาสสิก สมมติฐานหลักมีดังนี้:

ข้อมูลสังเกตเป็นอิสระต่อกัน
ตัวแปรตอบสนองวัดในสเกลเชิงปริมาณ
ความแปรปรวนของแต่ละกลุ่มใกล้เคียงกันพอสมควร
แบบจำลองไม่ขัดกับลักษณะของข้อมูลมากเกินไป โดยเฉพาะเมื่อขนาดตัวอย่างเล็ก

ANOVA ยังอาจมีความทนทานต่อการละเมิดสมมติฐานได้พอสมควรในหลายสถานการณ์ โดยเฉพาะเมื่อกลุ่มมีขนาดสมดุลและขนาดตัวอย่างปานกลาง แต่ทั้งนี้ขึ้นอยู่กับการออกแบบการศึกษา หากข้อมูลเป็นแบบจับคู่ วัดซ้ำในบุคคลเดิม หรือมีความแปรปรวนไม่เท่ากันอย่างมาก one-way ANOVA แบบปกติอาจไม่ใช่เครื่องมือที่เหมาะ

ตัวอย่าง One-Way ANOVA

สมมติว่าครูคนหนึ่งต้องการเปรียบเทียบวิธีการอ่านหนังสือ 3 วิธีโดยใช้คะแนนควิซ:

วิธี A: $72$ , $74$ , $76$
วิธี B: $78$ , $80$ , $82$
วิธี C: $84$ , $86$ , $88$

ค่าเฉลี่ยของแต่ละกลุ่มคือ

\bar{x}_A = 74, \qquad \bar{x}_B = 80, \qquad \bar{x}_C = 86

ค่าเฉลี่ยรวมของคะแนนทั้ง $9$ ค่า คือ

\bar{x} = 80

ตอนนี้แยกความแปรปรวนออกเป็น 2 ส่วน

ขั้นที่ 1: ความแปรปรวนระหว่างกลุ่ม

แต่ละกลุ่มมีข้อมูล $3$ ค่า ดังนั้นผลรวมกำลังสองระหว่างกลุ่มคือ

SS_B = 3(74-80)^2 + 3(80-80)^2 + 3(86-80)^2

SS_B = 3(36) + 0 + 3(36) = 216

เมื่อมี $k=3$ กลุ่ม องศาอิสระระหว่างกลุ่มคือ $k-1=2$ ดังนั้น

MS_B = \frac{SS_B}{k-1} = \frac{216}{2} = 108

ขั้นที่ 2: ความแปรปรวนภายในกลุ่ม

ภายในแต่ละกลุ่ม คะแนนแต่ละค่าห่างจากค่าเฉลี่ยของกลุ่มเพียง $2$ คะแนนในแต่ละด้าน:

SS_W = (4+0+4) + (4+0+4) + (4+0+4) = 24

เมื่อมีข้อมูลทั้งหมด $N=9$ ค่า องศาอิสระภายในกลุ่มคือ $N-k=6$ ดังนั้น

MS_W = \frac{SS_W}{N-k} = \frac{24}{6} = 4

ขั้นที่ 3: คำนวณค่าสถิติ $F$

ตอนนี้คำนวณ

F = \frac{MS_B}{MS_W} = \frac{108}{4} = 27

ค่า $F$ ที่สูงขนาดนี้หมายความว่าค่าเฉลี่ยของกลุ่มอยู่ห่างกันมากเมื่อเทียบกับความแปรปรวนภายในกลุ่ม ภายใต้สมมติฐานปกติของ one-way ANOVA นี่เป็นหลักฐานที่แรงต่อสมมติฐานศูนย์ที่ว่าค่าเฉลี่ยประชากรทั้งสามเท่ากัน

การตีความในทางปฏิบัตินั้นง่ายมาก: ความแตกต่างระหว่างวิธีการอ่านหนังสือทั้งสามมีขนาดใหญ่เกินกว่าจะอธิบายว่าเป็นเพียงการกระจายตัวปกติภายในกลุ่มเท่านั้น

สิ่งที่ ANOVA ไม่ได้บอกคุณ

ANOVA ไม่ได้บอกว่าคู่ของกลุ่มใดแตกต่างกันโดยเฉพาะ หลังจากได้ผลภาพรวมที่มีนัยสำคัญแล้ว โดยทั่วไปคุณจะต้องใช้การเปรียบเทียบหลังการทดสอบ (post-hoc) หรือ planned contrasts

นอกจากนี้ ANOVA ก็ไม่ได้บอกว่าผลที่พบมีความสำคัญในเชิงปฏิบัติจริงหรือไม่ ความแตกต่างที่ตรวจพบได้ทางสถิติอาจยังเล็กเกินกว่าจะมีความหมายในสถานการณ์จริง

หากการศึกษาไม่ได้สุ่มตัวอย่างหรือสุ่มจัดกลุ่ม ANOVA ก็ไม่ได้พิสูจน์ว่าตัวแปรจัดกลุ่มเป็นสาเหตุของความแตกต่าง มันเพียงทดสอบว่าค่าเฉลี่ยของกลุ่มดูแตกต่างกันหรือไม่ในข้อมูลที่คุณเก็บมา

ข้อผิดพลาดที่พบบ่อยเกี่ยวกับ ANOVA

ความเข้าใจผิดอย่างหนึ่งคือคิดว่า ANOVA เป็นการทดสอบหลักว่าความแปรปรวนของแต่ละกลุ่มเท่ากันหรือไม่ ในการใช้งานมาตรฐาน ANOVA ใช้เปรียบเทียบค่าเฉลี่ย ความแปรปรวนปรากฏอยู่เพราะมันเป็นกลไกที่ใช้วัดสัญญาณเทียบกับสัญญาณรบกวน

อีกข้อผิดพลาดหนึ่งคือทำ $t$ -test แยกหลายครั้งแทนที่จะทำ ANOVA แบบภาพรวมเพียงครั้งเดียวเมื่อมีหลายกลุ่มเข้ามาเกี่ยวข้อง วิธีนั้นอาจเพิ่มความเสี่ยงของการพบผลบวกลวง เว้นแต่จะมีการปรับการเปรียบเทียบอย่างระมัดระวัง

ข้อผิดพลาดข้อที่สามคือหยุดแค่ผล ANOVA มีนัยสำคัญแล้วอ้างว่ารู้แน่ชัดว่ากลุ่มใดดีที่สุด การทดสอบภาพรวมเพียงอย่างเดียวไม่สามารถตอบคำถามนั้นได้

ANOVA ใช้ที่ไหนบ้าง

ANOVA พบได้บ่อยในงานทดลอง การทดสอบผลิตภัณฑ์ การศึกษา ชีววิทยา เกษตรกรรม และสังคมศาสตร์ มันมีประโยชน์ทุกครั้งที่คุณต้องการการทดสอบเดียวที่น่าเชื่อถือสำหรับความแตกต่างของค่าเฉลี่ยระหว่างหลายกลุ่ม

มันมีประโยชน์เป็นพิเศษเมื่อคำถามที่แท้จริงเป็นคำถามเชิงเปรียบเทียบ: การรักษา วิธีการ หรือเงื่อนไขเหล่านี้ให้ผลลัพธ์เฉลี่ยที่แตกต่างกันอย่างวัดได้หรือไม่

ลองทำเวอร์ชันของคุณเอง

ใช้ตัวอย่างเดิมแล้วเปลี่ยนวิธี B เป็น $79$ , $80$ , $81$ จากนั้นคำนวณ $SS_W$ , $MS_W$ และค่าสถิติ $F$ สุดท้ายใหม่ การเปลี่ยนแปลงเพียงจุดเดียวนี้ทำให้เห็นแนวคิดหลักได้ชัดเจน: เมื่อสัญญาณรบกวนภายในกลุ่มเพิ่มขึ้น หลักฐานที่สนับสนุนว่ามีความแตกต่างของค่าเฉลี่ยจริงจะอ่อนลง

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →