การทดสอบ t ช่วยให้คุณตัดสินใจได้ว่า ค่าเฉลี่ยของกลุ่มตัวอย่าง หรือผลต่างระหว่างค่าเฉลี่ยของสองกลุ่มตัวอย่าง มีค่ามากกว่าที่ควรคาดจากความแปรปรวนแบบสุ่มเพียงอย่างเดียวหรือไม่ คุณใช้การทดสอบนี้เมื่อผลลัพธ์เป็นข้อมูลเชิงตัวเลข และไม่ทราบส่วนเบี่ยงเบนมาตรฐานของประชากร ซึ่งเป็นกรณีที่พบได้บ่อยในโลกจริง

เงื่อนไขสำคัญคือ การทดสอบต้องสอดคล้องกับรูปแบบของข้อมูล t-test ใช้กับคำถามที่เกี่ยวกับค่าเฉลี่ย ไม่ใช่จำนวนข้อมูลเชิงหมวดหมู่ และถ้าขนาดตัวอย่างเล็กมากก็ต้องระวังเป็นพิเศษหากข้อมูลมีความเบ้มากหรือมีค่าผิดปกติชัดเจน

t-test วัดอะไร

แนวคิดพื้นฐานเหมือนกันเสมอ:

t=observed differenceestimated standard errort = \frac{\text{observed difference}}{\text{estimated standard error}}

ค่าสถิตินี้จะมีค่ามากขึ้นเมื่อผลต่างของค่าเฉลี่ยมีขนาดใหญ่ และจะมีค่าน้อยลงเมื่อข้อมูลมีความผันผวนมากหรือขนาดตัวอย่างเล็ก

ภายใต้สมมติฐานศูนย์ และเมื่อเงื่อนไขต่าง ๆ สมเหตุสมผล ค่าสถิตินี้จะเป็นไปตามการแจกแจง tt แทนที่จะเป็นการแจกแจงปกติแบบ zz การแจกแจง tt มีหางหนากว่า โดยเฉพาะเมื่อขนาดตัวอย่างเล็ก จึงระมัดระวังมากกว่าในการสรุปว่าผลมีนัยสำคัญ

ควรใช้ t-test ประเภทไหน

One-sample t-test

ใช้เมื่อคุณมีข้อมูลจากกลุ่มตัวอย่างเดียว และต้องการเปรียบเทียบค่าเฉลี่ยของกลุ่มนั้นกับค่าอ้างอิง μ0\mu_0

t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

ตัวอย่าง: เปรียบเทียบน้ำหนักเฉลี่ยของสินค้าในหนึ่งกลุ่มตัวอย่างกับเป้าหมายที่ 100100 กรัม

Two-sample t-test

ใช้เมื่อคุณต้องการเปรียบเทียบค่าเฉลี่ยของสองกลุ่มอิสระ เช่น นักเรียนสองห้องที่เรียนด้วยวิธีสอนต่างกัน

ถ้าคุณไม่มีเหตุผลชัดเจนพอที่จะสมมติว่าความแปรปรวนของประชากรทั้งสองเท่ากัน โดยทั่วไป Welch's t-test เป็นตัวเลือกเริ่มต้นที่ปลอดภัยกว่า:

t=xˉ1xˉ2s12n1+s22n2t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

องศาอิสระของ Welch's test ไม่ได้เท่ากับ n1+n22n_1 + n_2 - 2 แบบง่าย ๆ ดังนั้นโดยทั่วไปซอฟต์แวร์จะจัดการส่วนนี้ให้

Paired t-test

ใช้กับข้อมูลก่อน-หลัง หรือข้อมูลแบบจับคู่ การทดสอบนี้ไม่ได้ทำกับข้อมูลดิบสองคอลัมน์แยกกัน แต่ทำกับผลต่างของแต่ละคู่

t=dˉμd,0sd/nt = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

ในปัญหาแบบจับคู่หลายกรณี ค่าในสมมติฐานศูนย์คือ μd,0=0\mu_{d,0} = 0 ซึ่งหมายความว่าการเปลี่ยนแปลงเฉลี่ยเท่ากับศูนย์

เมื่อไรที่ t-test เหมาะสม

t-test เหมาะเมื่อเงื่อนไขต่อไปนี้เป็นจริงอย่างสมเหตุสมผลทั้งหมด:

  1. ตัวแปรผลลัพธ์เป็นข้อมูลเชิงตัวเลข
  2. ข้อมูลสังเกตเป็นอิสระกันภายในรูปแบบการศึกษาที่เลือก เว้นแต่คุณตั้งใจใช้ข้อมูลแบบจับคู่
  3. คำถามเกี่ยวข้องกับค่าเฉลี่ยหรือผลต่างของค่าเฉลี่ย
  4. ขนาดตัวอย่างไม่เล็กมากจนค่าผิดปกติหรือความเบ้รุนแรงทำให้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานชวนให้เข้าใจผิด

ถ้าทราบส่วนเบี่ยงเบนมาตรฐานของประชากรอย่างแน่นอน การทดสอบ zz ตามตำราจะเป็นทางเลือกโดยตรง ในทางปฏิบัติ t-test พบได้บ่อยกว่า เพราะโดยทั่วไปเราไม่ทราบค่า σ\sigma

ตัวอย่างคำนวณ: one-sample t-test

สมมติว่ากระบวนการบรรจุภัณฑ์ควรมีค่าเฉลี่ย 100100 กรัม คุณสุ่มตัวอย่างบรรจุภัณฑ์มา 2525 ชิ้น และพบว่า

xˉ=102,s=4\bar{x} = 102, \quad s = 4

คุณต้องการทราบว่าค่าเฉลี่ยที่แท้จริงแตกต่างจาก 100100 กรัมหรือไม่

เนื่องจากนี่คือข้อมูลจากกลุ่มตัวอย่างเดียวที่เปรียบเทียบกับค่าเป้าหมาย การทดสอบที่ถูกต้องคือ one-sample t-test

เริ่มจากตั้งสมมติฐาน:

H0:μ=100H_0: \mu = 100 H1:μ100H_1: \mu \ne 100

ค่าคลาดเคลื่อนมาตรฐานคือ

sn=425=45=0.8\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

จากนั้นคำนวณค่าสถิติทดสอบ:

t=1021000.8=2.5t = \frac{102 - 100}{0.8} = 2.5

องศาอิสระคือ

df=n1=24df = n - 1 = 24

สำหรับการทดสอบสองทางที่มี df=24df = 24 ค่า t=2.5t = 2.5 ให้ค่า p ต่ำกว่า 0.050.05 นั่นหมายความว่าผลลัพธ์มีนัยสำคัญทางสถิติที่ระดับ 5%5\% ดังนั้นคุณปฏิเสธ H0H_0

ในบริบทนี้ กลุ่มตัวอย่างให้หลักฐานว่าค่าเฉลี่ยของกระบวนการแตกต่างจาก 100100 กรัม ข้อสรุปนี้ขึ้นอยู่กับการที่ข้อมูลตัวอย่างมีความเป็นอิสระกันพอสมควร และไม่ถูกบิดเบือนอย่างมากจากค่าผิดปกติ

ข้อผิดพลาดที่พบบ่อยในการใช้ t-test

ข้อผิดพลาดที่พบบ่อยอย่างหนึ่งคือเลือกชนิดของการทดสอบผิด ถ้าคนเดิม เครื่องเดิม หรือหน่วยเดิมถูกวัดสองครั้ง ข้อมูลนั้นเป็นข้อมูลแบบจับคู่ ดังนั้นการใช้ two-sample t-test แบบอิสระจึงไม่เหมาะสม

อีกข้อผิดพลาดหนึ่งคือการตีความว่า “ไม่มีนัยสำคัญทางสถิติ” เท่ากับ “ไม่มีความแตกต่าง” โดยทั่วไปแล้วมันหมายถึงกลุ่มตัวอย่างยังให้หลักฐานไม่มากพอที่จะโต้แย้งสมมติฐานศูนย์

ข้อผิดพลาดข้อที่สามคือข้ามขั้นตอนการตรวจสอบข้อมูล ถ้าขนาดตัวอย่างเล็กมากและมีค่าผิดปกติรุนแรงเพียงค่าเดียว สูตรก็ยังคำนวณออกมาเป็นตัวเลขได้ แต่ข้อสรุปอาจไม่น่าเชื่อถือ

t-test ใช้ที่ไหนบ้าง

t-test พบได้บ่อยในงานทดลอง การควบคุมคุณภาพ การแพทย์ จิตวิทยา การศึกษา และการเปรียบเทียบแบบ A/B เมื่อผลลัพธ์เป็นข้อมูลเชิงตัวเลข มันเป็นหนึ่งในจุดเริ่มต้นมาตรฐานของการอนุมานทางสถิติ เพราะเชื่อมโยงค่าเฉลี่ย ความแปรปรวน ความไม่แน่นอน และการตัดสินใจไว้ในวิธีเดียวกัน

ลองทำโจทย์ที่คล้ายกัน

เปลี่ยนตัวอย่างให้ค่าเฉลี่ยของกลุ่มตัวอย่างเป็น 101101 แทน 102102 โดยคง n=25n = 25 และ s=4s = 4 ไว้เหมือนเดิม แล้วคำนวณค่าสถิติ t ใหม่และตัดสินใจว่าหลักฐานยังมากพอที่ระดับ 5%5\% หรือไม่ นี่เป็นขั้นต่อไปที่ดีถ้าคุณอยากเห็นว่าข้อสรุปเปลี่ยนไปอย่างไรเมื่อค่าเฉลี่ยของกลุ่มตัวอย่างเข้าใกล้ค่าตามสมมติฐานศูนย์มากขึ้น

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →