T-Testi — Türleri, Formülü ve Ne Zaman Kullanılır

Bir t-testi, bir örneklem ortalamasının ya da iki örneklem ortalaması arasındaki farkın, yalnızca rastgele değişkenlikle bekleyeceğinizden daha büyük olup olmadığına karar vermenize yardımcı olur. Sonuç değişkeni sayısal olduğunda ve anakütle standart sapması bilinmediğinde kullanılır; bu da gerçek hayatta en yaygın durumdur.

Temel koşul, testin verinin tasarımına uygun olmasıdır. T-testi, kategorik sayımlar için değil ortalamaya dayalı sorular içindir; ayrıca çok küçük örneklemlerde belirgin çarpıklık veya açık aykırı değerler varsa dikkatli olunmalıdır.

T-testi neyi ölçer

Temel fikir her zaman aynıdır:

t = \frac{\text{observed difference}}{\text{estimated standard error}}

Ortalama farkı büyük olduğunda istatistik büyür; veriler gürültülü olduğunda veya örneklem küçük olduğunda ise küçülür.

Sıfır hipotezi altında ve koşullar makulse, bu istatistik normal $z$ dağılımı yerine $t$ dağılımını izler. $t$ dağılımının, özellikle küçük örneklemlerde, kuyrukları daha kalındır; bu yüzden bir sonucu anlamlı ilan etme konusunda daha temkinlidir.

Hangi t-testi türünü kullanmalısınız

Tek örneklem t-testi

Tek bir örnekleminiz varsa ve ortalamasını bir referans değer $\mu_0$ ile karşılaştırmak istiyorsanız bunu kullanın.

t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

Örnek: Bir örneklemdeki ortalama paket ağırlığını $100$ gramlık hedefle karşılaştırmak.

İki örneklem t-testi

Farklı yöntemlerle eğitilen iki sınıf gibi, iki bağımsız grubun ortalamalarını karşılaştırmak istediğinizde bunu kullanın.

Anakütle varyanslarının eşit olduğunu varsaymak için güçlü bir nedeniniz yoksa, Welch t-testi genellikle daha güvenli varsayılan seçenektir:

t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

Welch testinde serbestlik derecesi basitçe $n_1 + n_2 - 2$ değildir; bu yüzden bu kısmı genellikle yazılım sizin için hesaplar.

Eşleştirilmiş t-testi

Bunu önce-sonra verileri veya eşleştirilmiş çiftler için kullanın. Test, iki ham sütun üzerinde ayrı ayrı uygulanmaz. Eşler arasındaki farklar üzerinde uygulanır.

t = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

Birçok eşleştirilmiş problemde sıfır değeri $\mu_{d,0} = 0$ olur; yani ortalama değişim sıfırdır.

T-testi ne zaman uygundur

Şu koşulların tümü makul ölçüde sağlanıyorsa t-testi iyi bir seçimdir:

Sonuç değişkeni sayısaldır.
Bilerek eşleştirilmiş bir düzen kullanmıyorsanız, seçilen tasarım içinde gözlemler bağımsızdır.
Soru bir ortalama ya da ortalama farkı hakkındadır.
Örneklem, aykırı değerler veya güçlü çarpıklık nedeniyle ortalama ve standart sapmayı yanıltıcı hale getirecek kadar küçük ve bozulmuş değildir.

Anakütle standart sapması tam olarak bilinseydi, ders kitabı tipi bir $z$ -testi doğrudan alternatif olurdu. Uygulamada t-testleri yaygındır çünkü $\sigma$ genellikle bilinmez.

Çözümlü örnek: tek örneklem t-testi

Bir paketleme sürecinin ortalama $100$ gram olması gerektiğini varsayalım. Rastgele seçilmiş $25$ paketlik bir örneklem alıyorsunuz ve

\bar{x} = 102, \quad s = 4

buluyorsunuz.

Gerçek ortalamanın $100$ gramdan farklı olup olmadığını öğrenmek istiyorsunuz.

Bu, hedef bir değerle karşılaştırılan tek bir örneklem olduğu için doğru test tek örneklem t-testidir.

Hipotezlerle başlayın:

H_0: \mu = 100

H_1: \mu \ne 100

Standart hata

\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

şeklindedir.

Şimdi test istatistiğini hesaplayın:

t = \frac{102 - 100}{0.8} = 2.5

Serbestlik derecesi

df = n - 1 = 24

olur.

$df = 24$ için çift yönlü bir testte, $t = 2.5$ değeri $0.05$ 'in altında bir p-değeri verir. Bu, sonucun $5\%$ düzeyinde istatistiksel olarak anlamlı olduğu anlamına gelir; dolayısıyla $H_0$ reddedilir.

Bağlam içinde yorumlarsak, örneklem sürecin ortalamasının $100$ gramdan farklı olduğuna dair kanıt sağlar. Bu sonuç, örneklemin makul ölçüde bağımsız olmasına ve aykırı değerler tarafından ciddi biçimde bozulmamış olmasına bağlıdır.

T-testlerinde yaygın hatalar

Yaygın hatalardan biri testin yanlış türünü seçmektir. Aynı kişiler, makineler veya birimler iki kez ölçülüyorsa veriler eşleştirilmiştir; bu durumda bağımsız iki örneklem t-testi uygun değildir.

Bir başka hata, "istatistiksel olarak anlamlı değil" sonucunu "fark yok" diye okumaktır. Genellikle bu, örneklemin sıfır hipotezine karşı yeterince güçlü kanıt sunmadığı anlamına gelir.

Üçüncü bir hata da veri kontrolünü atlamaktır. Çok küçük bir örneklemde tek bir aşırı aykırı değer varsa, formül yine bir sayı üretir; ancak sonuç güvenilir olmayabilir.

T-testleri nerelerde kullanılır

T-testleri, sonuç değişkeninin sayısal olduğu deneylerde, kalite kontrolde, tıpta, psikolojide, eğitimde ve A/B tarzı karşılaştırmalarda yaygındır. İstatistiksel çıkarıma girişte standart başlangıç noktalarından biridir; çünkü ortalamaları, değişkenliği, belirsizliği ve karar vermeyi tek bir yöntemde birleştirir.

Benzer bir problem deneyin

Örneği, örneklem ortalaması $102$ yerine $101$ olacak şekilde değiştirin; $n = 25$ ve $s = 4$ aynı kalsın. t istatistiğini yeniden hesaplayın ve kanıtın $5\%$ düzeyinde hâlâ yeterince güçlü olup olmadığına karar verin. Örneklem ortalaması sıfır hipotezindeki değere yaklaştıkça sonucun nasıl değiştiğini görmek istiyorsanız bu yararlı bir sonraki adımdır.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →