Hipotez Testi

Hipotez testi, örneklem verisinin başlangıçtaki bir iddiayla fazla tutarsız görünüp görünmediğini sormanın bir yoludur. Bu başlangıç iddiasına sıfır hipotezi denir ve $H_0$ ile gösterilir.

Bu yöntem $H_0$ 'ın doğru ya da yanlış olduğunu kanıtlamaz. Daha dar bir soru sorar: Eğer $H_0$ doğru olsaydı, bu kadar uç bir veri sonucu ondan şüphe etmemiz gerekecek kadar sıra dışı olur muydu?

Temel Fikir

Her hipotez testinde birbiriyle yarışan iki ifade vardır:

Test edilen varsayılan iddia olan sıfır hipotezi $H_0$ .
Veri $H_0$ 'a karşı yeterli kanıt verirse destekleyeceğiniz alternatif hipotez $H_1$ veya $H_a$ .

Daha sonuca bakmadan önce, genellikle $0.05$ olan bir anlamlılık düzeyi $\alpha$ seçersiniz. Bu, $H_0$ 'ı reddetmeden önce ne kadar kanıt istediğinizin eşik değeridir.

İki sonuç mümkündür:

$H_0$ reddedilir: veri, sıfır modelle yeterince tutarsızdır.
$H_0$ reddedilemez: veri, sıfır modeli dışlamak için yeterince güçlü değildir.

"Reddedilemez" ifadesi, "doğru kabul edilir" ile aynı şey değildir. Yalnızca örneklemin $H_0$ 'a karşı yeterince güçlü kanıt sunmadığı anlamına gelir.

Alışılmış Adımlar

İş akışı genellikle şöyledir:

$H_0$ ve $H_1$ 'i açıkça belirtin.
$\alpha$ değerini ve veriye ve varsayımlara uygun bir testi seçin.
Örneklemden bir test istatistiği hesaplayın.
Bu istatistiği bir $p$ -değerine dönüştürün veya kritik bir değerle karşılaştırın.
Kararı verin ve bağlam içinde yorumlayın.

Test istatistiği duruma bağlıdır. $z$ -testi, $t$ -testi, ki-kare testi ve daha birçok yöntem hipotez testine örnektir. Tüm hipotez testleri için geçerli tek bir formül yoktur.

$p$ -Değeri Ne Anlama Gelir?

$p$ -değeri, $H_0$ 'ın doğru olduğu ve test varsayımlarının sağlandığı kabulü altında, gözlenen sonuç kadar ya da ondan daha uç bir sonucun elde edilme olasılığıdır.

Küçük bir $p$ -değeri, verinin $H_0$ altında sıra dışı olacağını gösterir. Bu yüzden küçük $p$ -değerleri sıfır hipotezine karşı kanıt sayılır.

Şu anlamlara gelmez:

$H_0$ 'ın yanlış olma olasılığı.
Sonucunuzun belirsiz, günlük anlamda "tamamen şans eseri" ortaya çıkma olasılığı.
Etkinin büyüklüğü ya da önemi.

Hipotez Testlerinin Temel Türleri

Testleri gruplandırmanın iki yararlı yolu vardır.

Yöne Göre

Tek kuyruklu test, yalnızca tek bir yöndeki değişimi araştırır.

Sağ kuyruklu: sıfır hipotezindeki değerden büyük değerler $H_1$ 'i destekler.
Sol kuyruklu: sıfır hipotezindeki değerden küçük değerler $H_1$ 'i destekler.

Çift kuyruklu test, her iki yöndeki farkı da araştırır. Eğer $H_1$ "eşit değildir" şeklindeyse, red bölgesi iki kuyruğa bölünür.

Veri Durumuna Göre

$z$ -testi, anakütle standart sapmasının bilindiği ya da gerekçeli bir büyük örneklem yaklaşımının kullanıldığı bazı ortalama testlerinde kullanılır.
$t$ -testi, anakütle standart sapması bilinmediğinde ve koşullar makul olduğunda ortalamalar için yaygındır.
Ki-kare testi, kategorik sayım verileri için kullanılır.

Doğru test; değişken türüne, örneklem tasarımına ve varsayımlara bağlıdır. Önce formülü seçip soruyu sonra düşünmek yaygın bir hatadır.

Çözümlü Örnek

Bir dolum makinesinin şişe başına ortalama $500$ mL doldurması gerektiğini varsayalım. Bir kalite kontrol ekibi $36$ şişelik bir örneklem alıyor ve örneklem ortalamasını $496$ mL buluyor.

Bu örnekte, anakütle standart sapmasının $\sigma = 12$ mL olarak bilindiğini ve örnekleme koşullarının tek örneklemli bir $z$ -testini uygun kıldığını varsayalım.

Hipotezleri kuralım:

H_0: \mu = 500

H_1: \mu < 500

Bu, sol kuyruklu bir testtir çünkü endişe eksik dolumdur.

Standart hata şöyledir:

\frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{36}} = 2

Dolayısıyla test istatistiği

z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{496 - 500}{2} = -2

Eğer sol kuyruklu bir $z$ -testi için $\alpha = 0.05$ ise, kritik değer yaklaşık $-1.645$ 'tir. $-2 < -1.645$ olduğundan sonuç red bölgesine düşer.

Bu nedenle karar, $5\%$ düzeyinde $H_0$ 'ı reddetmektir. Bağlam içinde, örneklem makinenin ortalama olarak eksik dolum yaptığına dair kanıt sağlar.

Bu sonuç test varsayımlarına bağlıdır. Varsayımlar zayıfsa, aritmetik doğru olsa bile sonuç güvenilir olmayabilir.

Tip I ve Tip II Hatalar

Hipotez testi her zaman hata riski içerir.

Tip I hata, $H_0$ doğru olduğu halde onu reddetmek demektir. Bunun olasılığı $\alpha$ ile kontrol edilir.

Tip II hata, $H_1$ doğru olduğu halde $H_0$ 'ı reddedememek demektir. Bunun olasılığı genellikle $\beta$ ile gösterilir.

$\alpha$ değerini düşürmek yanlış alarm olasılığını azaltır, ancak başka hiçbir şey değişmezse gerçek etkileri tespit etmeyi de zorlaştırabilir. Örneklem büyüklüğünün önemli olmasının nedenlerinden biri bu dengedir.

Yaygın Hatalar

Yaygın bir hata, anlamlı olmayan bir sonucun hiçbir etki olmadığını kanıtladığını söylemektir. Genellikle bu sadece verinin bir etkiyi saptamak için yeterince güçlü olmadığını gösterir.

Bir başka hata da istatistiksel anlamlılığı pratik önemle aynı şey sanmaktır. Çok küçük bir etki, çok büyük bir örneklemde istatistiksel olarak anlamlı olabilir.

İnsanlar ayrıca bağımsızlık, dağılım şekli, varyans veya veri türüyle ilgili varsayımları göz ardı ederek testleri yanlış kullanır. Düzgün görünen bir $p$ -değeri, yanlış seçilmiş bir testi kurtarmaz.

Hipotez Testi Ne Zaman Kullanılır?

Hipotez testi bilimde, üretimde, tıpta, anketlerde, A/B testlerinde ve politika analizinde kullanılır. Amaç genellikle aynıdır: örneklemin, varsayılan bir iddiayı sorgulamak için yeterli kanıt verip vermediğine karar vermek.

Uygulamada iyi bir test yalnızca hesaplamadan ibaret değildir. Aynı zamanda makul bir sıfır hipotezi, savunulabilir bir tasarım ve testin gerçekten ne söyleyebileceğine uygun bir yorum da gerektirir.

Kendi Versiyonunuzu Deneyin

Aynı şişe dolum örneğini alın, ancak örneklem ortalamasını $498$ mL olarak değiştirin. Test istatistiğini yeniden hesaplayın ve $\alpha = 0.05$ düzeyinde kararın değişip değişmediğine bakın. Bu, örneklem sonucu sıfır değerine yaklaştıkça kanıtın nasıl güçlendiğini ya da zayıfladığını görmenin hızlı bir yoludur.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →