Bir t-testi, bir örneklem ortalamasının ya da iki örneklem ortalaması arasındaki farkın, yalnızca rastgele değişkenlikle bekleyeceğinizden daha büyük olup olmadığına karar vermenize yardımcı olur. Sonuç değişkeni sayısal olduğunda ve anakütle standart sapması bilinmediğinde kullanılır; bu da gerçek hayatta en yaygın durumdur.

Temel koşul, testin verinin tasarımına uygun olmasıdır. T-testi, kategorik sayımlar için değil ortalamaya dayalı sorular içindir; ayrıca çok küçük örneklemlerde belirgin çarpıklık veya açık aykırı değerler varsa dikkatli olunmalıdır.

T-testi neyi ölçer

Temel fikir her zaman aynıdır:

t=observed differenceestimated standard errort = \frac{\text{observed difference}}{\text{estimated standard error}}

Ortalama farkı büyük olduğunda istatistik büyür; veriler gürültülü olduğunda veya örneklem küçük olduğunda ise küçülür.

Sıfır hipotezi altında ve koşullar makulse, bu istatistik normal zz dağılımı yerine tt dağılımını izler. tt dağılımının, özellikle küçük örneklemlerde, kuyrukları daha kalındır; bu yüzden bir sonucu anlamlı ilan etme konusunda daha temkinlidir.

Hangi t-testi türünü kullanmalısınız

Tek örneklem t-testi

Tek bir örnekleminiz varsa ve ortalamasını bir referans değer μ0\mu_0 ile karşılaştırmak istiyorsanız bunu kullanın.

t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

Örnek: Bir örneklemdeki ortalama paket ağırlığını 100100 gramlık hedefle karşılaştırmak.

İki örneklem t-testi

Farklı yöntemlerle eğitilen iki sınıf gibi, iki bağımsız grubun ortalamalarını karşılaştırmak istediğinizde bunu kullanın.

Anakütle varyanslarının eşit olduğunu varsaymak için güçlü bir nedeniniz yoksa, Welch t-testi genellikle daha güvenli varsayılan seçenektir:

t=xˉ1xˉ2s12n1+s22n2t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

Welch testinde serbestlik derecesi basitçe n1+n22n_1 + n_2 - 2 değildir; bu yüzden bu kısmı genellikle yazılım sizin için hesaplar.

Eşleştirilmiş t-testi

Bunu önce-sonra verileri veya eşleştirilmiş çiftler için kullanın. Test, iki ham sütun üzerinde ayrı ayrı uygulanmaz. Eşler arasındaki farklar üzerinde uygulanır.

t=dˉμd,0sd/nt = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

Birçok eşleştirilmiş problemde sıfır değeri μd,0=0\mu_{d,0} = 0 olur; yani ortalama değişim sıfırdır.

T-testi ne zaman uygundur

Şu koşulların tümü makul ölçüde sağlanıyorsa t-testi iyi bir seçimdir:

  1. Sonuç değişkeni sayısaldır.
  2. Bilerek eşleştirilmiş bir düzen kullanmıyorsanız, seçilen tasarım içinde gözlemler bağımsızdır.
  3. Soru bir ortalama ya da ortalama farkı hakkındadır.
  4. Örneklem, aykırı değerler veya güçlü çarpıklık nedeniyle ortalama ve standart sapmayı yanıltıcı hale getirecek kadar küçük ve bozulmuş değildir.

Anakütle standart sapması tam olarak bilinseydi, ders kitabı tipi bir zz-testi doğrudan alternatif olurdu. Uygulamada t-testleri yaygındır çünkü σ\sigma genellikle bilinmez.

Çözümlü örnek: tek örneklem t-testi

Bir paketleme sürecinin ortalama 100100 gram olması gerektiğini varsayalım. Rastgele seçilmiş 2525 paketlik bir örneklem alıyorsunuz ve

xˉ=102,s=4\bar{x} = 102, \quad s = 4

buluyorsunuz.

Gerçek ortalamanın 100100 gramdan farklı olup olmadığını öğrenmek istiyorsunuz.

Bu, hedef bir değerle karşılaştırılan tek bir örneklem olduğu için doğru test tek örneklem t-testidir.

Hipotezlerle başlayın:

H0:μ=100H_0: \mu = 100 H1:μ100H_1: \mu \ne 100

Standart hata

sn=425=45=0.8\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

şeklindedir.

Şimdi test istatistiğini hesaplayın:

t=1021000.8=2.5t = \frac{102 - 100}{0.8} = 2.5

Serbestlik derecesi

df=n1=24df = n - 1 = 24

olur.

df=24df = 24 için çift yönlü bir testte, t=2.5t = 2.5 değeri 0.050.05'in altında bir p-değeri verir. Bu, sonucun 5%5\% düzeyinde istatistiksel olarak anlamlı olduğu anlamına gelir; dolayısıyla H0H_0 reddedilir.

Bağlam içinde yorumlarsak, örneklem sürecin ortalamasının 100100 gramdan farklı olduğuna dair kanıt sağlar. Bu sonuç, örneklemin makul ölçüde bağımsız olmasına ve aykırı değerler tarafından ciddi biçimde bozulmamış olmasına bağlıdır.

T-testlerinde yaygın hatalar

Yaygın hatalardan biri testin yanlış türünü seçmektir. Aynı kişiler, makineler veya birimler iki kez ölçülüyorsa veriler eşleştirilmiştir; bu durumda bağımsız iki örneklem t-testi uygun değildir.

Bir başka hata, "istatistiksel olarak anlamlı değil" sonucunu "fark yok" diye okumaktır. Genellikle bu, örneklemin sıfır hipotezine karşı yeterince güçlü kanıt sunmadığı anlamına gelir.

Üçüncü bir hata da veri kontrolünü atlamaktır. Çok küçük bir örneklemde tek bir aşırı aykırı değer varsa, formül yine bir sayı üretir; ancak sonuç güvenilir olmayabilir.

T-testleri nerelerde kullanılır

T-testleri, sonuç değişkeninin sayısal olduğu deneylerde, kalite kontrolde, tıpta, psikolojide, eğitimde ve A/B tarzı karşılaştırmalarda yaygındır. İstatistiksel çıkarıma girişte standart başlangıç noktalarından biridir; çünkü ortalamaları, değişkenliği, belirsizliği ve karar vermeyi tek bir yöntemde birleştirir.

Benzer bir problem deneyin

Örneği, örneklem ortalaması 102102 yerine 101101 olacak şekilde değiştirin; n=25n = 25 ve s=4s = 4 aynı kalsın. t istatistiğini yeniden hesaplayın ve kanıtın 5%5\% düzeyinde hâlâ yeterince güçlü olup olmadığına karar verin. Örneklem ortalaması sıfır hipotezindeki değere yaklaştıkça sonucun nasıl değiştiğini görmek istiyorsanız bu yararlı bir sonraki adımdır.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →