Normal dağılım, ortalamaya yakın değerlerin en sık görüldüğü ve ortalamadan uzaklaştıkça değerlerin simetrik biçimde daha seyrekleştiği çan biçimli bir olasılık modelidir. Çan eğrisini, z-skorunu veya normal dağılım formülünü anlamaya çalışıyorsanız temel fikir basittir: ortalama merkezi belirler, standart sapma ise yayılımı belirler.

Bu model yalnızca normal şekil veri ya da durum için makul bir uyum sağladığında kullanışlıdır. Bu koşul sağlandığında tipik aralıkları tahmin edebilir, değerleri z-skorlarıyla karşılaştırabilir ve bir sonucun ne kadar sıra dışı olduğunu yorumlayabilirsiniz.

Çan eğrisi ne anlama gelir?

Bir değişken normal dağılım izliyorsa, ortalamaya yakın değerler uzaktaki değerlere göre daha yaygındır. Sol ve sağ taraf birbirinin aynasıdır; bu yüzden ortalamanın 22 standart sapma üstünde olmak, ortalamanın 22 standart sapma altında olmak kadar sıra dışıdır.

Sıkça şu gösterimi görürsünüz:

XN(μ,σ2)X \sim N(\mu, \sigma^2)

Bu, rassal değişken XX'in ortalaması μ\mu ve varyansı σ2\sigma^2 olan normal dağılımla modellendiği anlamına gelir. Varyans σ2\sigma^2 olduğuna göre standart sapma σ\sigma'dır ve burada σ>0\sigma > 0.

Normal dağılım formülü, sade bir dille

Normal yoğunluk formülü şöyledir:

f(x)=1σ2πe(xμ)2/(2σ2)f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-(x-\mu)^2/(2\sigma^2)}

Bu fikri iyi kullanmak için formülün her parçasını ezberlemeniz gerekmez. En önemli nokta, μ\mu'nün eğriyi sola ya da sağa kaydırması; σ\sigma'nın ise onu daha dar ya da daha geniş yapmasıdır.

Bu formül, tek bir kesin değerin olasılığını değil yoğunluğu açıklar. Sürekli bir modelde olasılıklar P(X<80)P(X < 80) veya P(65X85)P(65 \le X \le 85) gibi aralıklardan elde edilir.

Ortalama, standart sapma ve z-skoru nasıl bağlantılıdır?

Ortalamayı değiştirmek eğriyi sola ya da sağa kaydırır. Standart sapmayı değiştirmek eğriyi daha dar ya da daha geniş yapar. Küçük bir σ\sigma, değerlerin ortalama çevresinde sıkı biçimde toplandığı anlamına gelir. Daha büyük bir σ\sigma ise değerlerin daha yayılmış olduğunu gösterir.

Bir değeri dağılımın geri kalanıyla karşılaştırmak için z-skorunu kullanın:

z=xμσz = \frac{x - \mu}{\sigma}

Bu, göreli konumu standart sapma birimleriyle verir. Eğer z=1.5z = 1.5 ise değer ortalamanın 1.51.5 standart sapma üstündedir. Eğer z=2z = -2 ise ortalamanın 22 standart sapma altındadır.

Normal model için pratik bir kısa yol ampirik kuraldır:

yaklas¸ık 68% deg˘er μ±σ aralıg˘ındadır\text{yaklaşık } 68\% \text{ değer } \mu \pm \sigma \text{ aralığındadır} yaklas¸ık 95% deg˘er μ±2σ aralıg˘ındadır\text{yaklaşık } 95\% \text{ değer } \mu \pm 2\sigma \text{ aralığındadır} yaklas¸ık 99.7% deg˘er μ±3σ aralıg˘ındadır\text{yaklaşık } 99.7\% \text{ değer } \mu \pm 3\sigma \text{ aralığındadır}

Bunu yalnızca normal model gerçekten makulse kullanın. Bu, yararlı bir yaklaşımdır; her gerçek veri kümesi için garanti değildir.

Z-skoru ve çan eğrisiyle çözümlü örnek

Sınav puanlarının şu şekilde modellendiğini varsayalım:

XN(70,102)X \sim N(70, 10^2)

Buna göre ortalama puan 7070, standart sapma ise 1010'dur.

Önce ampirik kuralı kullanalım. Puanların yaklaşık 68%68\%'i ortalamanın bir standart sapma çevresinde olmalıdır:

70±1070 \pm 10

Dolayısıyla hızlı aralık şudur:

60 ile 8060 \text{ ile } 80

Puanların yaklaşık 95%95\%'i iki standart sapma içinde olmalıdır:

70±2(10)=70±2070 \pm 2(10) = 70 \pm 20

Dolayısıyla bu aralık da şöyledir:

50 ile 9050 \text{ ile } 90

Şimdi 8585 alan bir öğrenciyi ele alalım. Z-skoru:

z=857010=1.5z = \frac{85 - 70}{10} = 1.5

Bu, puanın ortalamanın 1.51.5 standart sapma üstünde olduğu anlamına gelir. En hızlı ve yararlı yorum şudur: puan açıkça ortalamanın üstündedir, ama kuyruğun çok uç kısmında değildir.

Normal dağılım sorularında yaygın hatalar

Her çan biçimli grafiği normal sanmak

Bazı veriler çarpık olabilir, kalın kuyruklara sahip olabilir ya da birden fazla tepe içerebilir. Bu durumlarda grafik kabaca yuvarlak görünse bile normal model zayıf bir uyum sağlayabilir.

Yoğunluğu olasılıkla karıştırmak

f(x)f(x) formülü, XX'in tek bir kesin sayıya eşit olma olasılığı değildir. Sürekli dağılımlarda tek bir noktanın olasılığı 00'dır; bu yüzden bunun yerine aralıklarla çalışılır.

Modeli kontrol etmeden ampirik kuralı kullanmak

6868-9595-99.799.7 kuralı normal dağılıma aittir. Her veri kümesine otomatik olarak uygulanmamalıdır.

Varyans ile standart sapmayı karıştırmak

Varyans σ2\sigma^2'dir. Z-skorunda σ\sigma kullanılır, σ2\sigma^2 değil.

Normal dağılım ne zaman kullanılır?

Normal dağılım, ölçümlerin merkezi bir değer etrafında toplandığı ve uç değerlerin görece seyrek olduğu durumlarda sık görülür. Ölçüm hatası modellerinde, sınav puanlarının yorumlanmasında, kalite kontrolde ve örneklem ortalamalarının incelenmesinde yaygındır.

Bu, tüm gerçek verilerin normal olduğu anlamına gelmez. Anlamı şudur: şekil, bağlam ve varsayımlar bu yaklaşımı makul kıldığında normal model yararlı bir yaklaşımdır.

Benzer bir soru deneyin

Örneği XN(100,152)X \sim N(100, 15^2) olacak şekilde değiştirin ve 130130 için z-skorunu hesaplayın. Sonra değerlerin yaklaşık 95%95\%'ini kapsayan aralığı bulun. Farklı bir ortalama ya da standart sapmayla kendi örneğinizi denemek, çan eğrisinin nasıl değiştiğini görmenin iyi bir yoludur.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →