การทดสอบ t (T-Test) — ประเภท สูตร และใช้เมื่อไร

การทดสอบ t ช่วยให้คุณตัดสินใจได้ว่า ค่าเฉลี่ยของกลุ่มตัวอย่าง หรือผลต่างระหว่างค่าเฉลี่ยของสองกลุ่มตัวอย่าง มีค่ามากกว่าที่ควรคาดจากความแปรปรวนแบบสุ่มเพียงอย่างเดียวหรือไม่ คุณใช้การทดสอบนี้เมื่อผลลัพธ์เป็นข้อมูลเชิงตัวเลข และไม่ทราบส่วนเบี่ยงเบนมาตรฐานของประชากร ซึ่งเป็นกรณีที่พบได้บ่อยในโลกจริง

เงื่อนไขสำคัญคือ การทดสอบต้องสอดคล้องกับรูปแบบของข้อมูล t-test ใช้กับคำถามที่เกี่ยวกับค่าเฉลี่ย ไม่ใช่จำนวนข้อมูลเชิงหมวดหมู่ และถ้าขนาดตัวอย่างเล็กมากก็ต้องระวังเป็นพิเศษหากข้อมูลมีความเบ้มากหรือมีค่าผิดปกติชัดเจน

t-test วัดอะไร

แนวคิดพื้นฐานเหมือนกันเสมอ:

t = \frac{\text{observed difference}}{\text{estimated standard error}}

ค่าสถิตินี้จะมีค่ามากขึ้นเมื่อผลต่างของค่าเฉลี่ยมีขนาดใหญ่ และจะมีค่าน้อยลงเมื่อข้อมูลมีความผันผวนมากหรือขนาดตัวอย่างเล็ก

ภายใต้สมมติฐานศูนย์ และเมื่อเงื่อนไขต่าง ๆ สมเหตุสมผล ค่าสถิตินี้จะเป็นไปตามการแจกแจง $t$ แทนที่จะเป็นการแจกแจงปกติแบบ $z$ การแจกแจง $t$ มีหางหนากว่า โดยเฉพาะเมื่อขนาดตัวอย่างเล็ก จึงระมัดระวังมากกว่าในการสรุปว่าผลมีนัยสำคัญ

ควรใช้ t-test ประเภทไหน

One-sample t-test

ใช้เมื่อคุณมีข้อมูลจากกลุ่มตัวอย่างเดียว และต้องการเปรียบเทียบค่าเฉลี่ยของกลุ่มนั้นกับค่าอ้างอิง $\mu_0$

t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

ตัวอย่าง: เปรียบเทียบน้ำหนักเฉลี่ยของสินค้าในหนึ่งกลุ่มตัวอย่างกับเป้าหมายที่ $100$ กรัม

Two-sample t-test

ใช้เมื่อคุณต้องการเปรียบเทียบค่าเฉลี่ยของสองกลุ่มอิสระ เช่น นักเรียนสองห้องที่เรียนด้วยวิธีสอนต่างกัน

ถ้าคุณไม่มีเหตุผลชัดเจนพอที่จะสมมติว่าความแปรปรวนของประชากรทั้งสองเท่ากัน โดยทั่วไป Welch's t-test เป็นตัวเลือกเริ่มต้นที่ปลอดภัยกว่า:

t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

องศาอิสระของ Welch's test ไม่ได้เท่ากับ $n_1 + n_2 - 2$ แบบง่าย ๆ ดังนั้นโดยทั่วไปซอฟต์แวร์จะจัดการส่วนนี้ให้

Paired t-test

ใช้กับข้อมูลก่อน-หลัง หรือข้อมูลแบบจับคู่ การทดสอบนี้ไม่ได้ทำกับข้อมูลดิบสองคอลัมน์แยกกัน แต่ทำกับผลต่างของแต่ละคู่

t = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

ในปัญหาแบบจับคู่หลายกรณี ค่าในสมมติฐานศูนย์คือ $\mu_{d,0} = 0$ ซึ่งหมายความว่าการเปลี่ยนแปลงเฉลี่ยเท่ากับศูนย์

เมื่อไรที่ t-test เหมาะสม

t-test เหมาะเมื่อเงื่อนไขต่อไปนี้เป็นจริงอย่างสมเหตุสมผลทั้งหมด:

ตัวแปรผลลัพธ์เป็นข้อมูลเชิงตัวเลข
ข้อมูลสังเกตเป็นอิสระกันภายในรูปแบบการศึกษาที่เลือก เว้นแต่คุณตั้งใจใช้ข้อมูลแบบจับคู่
คำถามเกี่ยวข้องกับค่าเฉลี่ยหรือผลต่างของค่าเฉลี่ย
ขนาดตัวอย่างไม่เล็กมากจนค่าผิดปกติหรือความเบ้รุนแรงทำให้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานชวนให้เข้าใจผิด

ถ้าทราบส่วนเบี่ยงเบนมาตรฐานของประชากรอย่างแน่นอน การทดสอบ $z$ ตามตำราจะเป็นทางเลือกโดยตรง ในทางปฏิบัติ t-test พบได้บ่อยกว่า เพราะโดยทั่วไปเราไม่ทราบค่า $\sigma$

ตัวอย่างคำนวณ: one-sample t-test

สมมติว่ากระบวนการบรรจุภัณฑ์ควรมีค่าเฉลี่ย $100$ กรัม คุณสุ่มตัวอย่างบรรจุภัณฑ์มา $25$ ชิ้น และพบว่า

\bar{x} = 102, \quad s = 4

คุณต้องการทราบว่าค่าเฉลี่ยที่แท้จริงแตกต่างจาก $100$ กรัมหรือไม่

เนื่องจากนี่คือข้อมูลจากกลุ่มตัวอย่างเดียวที่เปรียบเทียบกับค่าเป้าหมาย การทดสอบที่ถูกต้องคือ one-sample t-test

เริ่มจากตั้งสมมติฐาน:

H_0: \mu = 100

H_1: \mu \ne 100

ค่าคลาดเคลื่อนมาตรฐานคือ

\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

จากนั้นคำนวณค่าสถิติทดสอบ:

t = \frac{102 - 100}{0.8} = 2.5

องศาอิสระคือ

df = n - 1 = 24

สำหรับการทดสอบสองทางที่มี $df = 24$ ค่า $t = 2.5$ ให้ค่า p ต่ำกว่า $0.05$ นั่นหมายความว่าผลลัพธ์มีนัยสำคัญทางสถิติที่ระดับ $5\%$ ดังนั้นคุณปฏิเสธ $H_0$

ในบริบทนี้ กลุ่มตัวอย่างให้หลักฐานว่าค่าเฉลี่ยของกระบวนการแตกต่างจาก $100$ กรัม ข้อสรุปนี้ขึ้นอยู่กับการที่ข้อมูลตัวอย่างมีความเป็นอิสระกันพอสมควร และไม่ถูกบิดเบือนอย่างมากจากค่าผิดปกติ

ข้อผิดพลาดที่พบบ่อยในการใช้ t-test

ข้อผิดพลาดที่พบบ่อยอย่างหนึ่งคือเลือกชนิดของการทดสอบผิด ถ้าคนเดิม เครื่องเดิม หรือหน่วยเดิมถูกวัดสองครั้ง ข้อมูลนั้นเป็นข้อมูลแบบจับคู่ ดังนั้นการใช้ two-sample t-test แบบอิสระจึงไม่เหมาะสม

อีกข้อผิดพลาดหนึ่งคือการตีความว่า “ไม่มีนัยสำคัญทางสถิติ” เท่ากับ “ไม่มีความแตกต่าง” โดยทั่วไปแล้วมันหมายถึงกลุ่มตัวอย่างยังให้หลักฐานไม่มากพอที่จะโต้แย้งสมมติฐานศูนย์

ข้อผิดพลาดข้อที่สามคือข้ามขั้นตอนการตรวจสอบข้อมูล ถ้าขนาดตัวอย่างเล็กมากและมีค่าผิดปกติรุนแรงเพียงค่าเดียว สูตรก็ยังคำนวณออกมาเป็นตัวเลขได้ แต่ข้อสรุปอาจไม่น่าเชื่อถือ

t-test ใช้ที่ไหนบ้าง

t-test พบได้บ่อยในงานทดลอง การควบคุมคุณภาพ การแพทย์ จิตวิทยา การศึกษา และการเปรียบเทียบแบบ A/B เมื่อผลลัพธ์เป็นข้อมูลเชิงตัวเลข มันเป็นหนึ่งในจุดเริ่มต้นมาตรฐานของการอนุมานทางสถิติ เพราะเชื่อมโยงค่าเฉลี่ย ความแปรปรวน ความไม่แน่นอน และการตัดสินใจไว้ในวิธีเดียวกัน

ลองทำโจทย์ที่คล้ายกัน

เปลี่ยนตัวอย่างให้ค่าเฉลี่ยของกลุ่มตัวอย่างเป็น $101$ แทน $102$ โดยคง $n = 25$ และ $s = 4$ ไว้เหมือนเดิม แล้วคำนวณค่าสถิติ t ใหม่และตัดสินใจว่าหลักฐานยังมากพอที่ระดับ $5\%$ หรือไม่ นี่เป็นขั้นต่อไปที่ดีถ้าคุณอยากเห็นว่าข้อสรุปเปลี่ยนไปอย่างไรเมื่อค่าเฉลี่ยของกลุ่มตัวอย่างเข้าใกล้ค่าตามสมมติฐานศูนย์มากขึ้น

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →