Basitçe normal dağılım nedir?

Normal dağılım, ortalamaya yakın değerlerin en sık görüldüğü ve ortalamadan uzaklaştıkça değerlerin çan biçimli, simetrik bir düzende daha seyrekleştiği sürekli ve simetrik bir olasılık modelidir.

Z-skoru size ne söyler?

Z-skoru, bir değerin ortalamanın kaç standart sapma üstünde ya da altında olduğunu gösterir. Kesin bir olasılığı tek başına vermez; göreli konumu açıklar.

Normal Dağılım — Çan Eğrisi, Z-Skoru ve Formül

Normal dağılım, ortalamaya yakın değerlerin en sık görüldüğü ve ortalamadan uzaklaştıkça değerlerin simetrik biçimde daha seyrekleştiği çan biçimli bir olasılık modelidir. Çan eğrisini, z-skorunu veya normal dağılım formülünü anlamaya çalışıyorsanız temel fikir basittir: ortalama merkezi belirler, standart sapma ise yayılımı belirler.

Bu model yalnızca normal şekil veri ya da durum için makul bir uyum sağladığında kullanışlıdır. Bu koşul sağlandığında tipik aralıkları tahmin edebilir, değerleri z-skorlarıyla karşılaştırabilir ve bir sonucun ne kadar sıra dışı olduğunu yorumlayabilirsiniz.

Çan eğrisi ne anlama gelir?

Bir değişken normal dağılım izliyorsa, ortalamaya yakın değerler uzaktaki değerlere göre daha yaygındır. Sol ve sağ taraf birbirinin aynasıdır; bu yüzden ortalamanın $2$ standart sapma üstünde olmak, ortalamanın $2$ standart sapma altında olmak kadar sıra dışıdır.

Sıkça şu gösterimi görürsünüz:

X \sim N(\mu, \sigma^2)

Bu, rassal değişken $X$ 'in ortalaması $\mu$ ve varyansı $\sigma^2$ olan normal dağılımla modellendiği anlamına gelir. Varyans $\sigma^2$ olduğuna göre standart sapma $\sigma$ 'dır ve burada $\sigma > 0$ .

Normal dağılım formülü, sade bir dille

Normal yoğunluk formülü şöyledir:

f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-(x-\mu)^2/(2\sigma^2)}

Bu fikri iyi kullanmak için formülün her parçasını ezberlemeniz gerekmez. En önemli nokta, $\mu$ 'nün eğriyi sola ya da sağa kaydırması; $\sigma$ 'nın ise onu daha dar ya da daha geniş yapmasıdır.

Bu formül, tek bir kesin değerin olasılığını değil yoğunluğu açıklar. Sürekli bir modelde olasılıklar $P(X < 80)$ veya $P(65 \le X \le 85)$ gibi aralıklardan elde edilir.

Ortalama, standart sapma ve z-skoru nasıl bağlantılıdır?

Ortalamayı değiştirmek eğriyi sola ya da sağa kaydırır. Standart sapmayı değiştirmek eğriyi daha dar ya da daha geniş yapar. Küçük bir $\sigma$ , değerlerin ortalama çevresinde sıkı biçimde toplandığı anlamına gelir. Daha büyük bir $\sigma$ ise değerlerin daha yayılmış olduğunu gösterir.

Bir değeri dağılımın geri kalanıyla karşılaştırmak için z-skorunu kullanın:

z = \frac{x - \mu}{\sigma}

Bu, göreli konumu standart sapma birimleriyle verir. Eğer $z = 1.5$ ise değer ortalamanın $1.5$ standart sapma üstündedir. Eğer $z = -2$ ise ortalamanın $2$ standart sapma altındadır.

Normal model için pratik bir kısa yol ampirik kuraldır:

\text{yaklaşık } 68\% \text{ değer } \mu \pm \sigma \text{ aralığındadır}

\text{yaklaşık } 95\% \text{ değer } \mu \pm 2\sigma \text{ aralığındadır}

\text{yaklaşık } 99.7\% \text{ değer } \mu \pm 3\sigma \text{ aralığındadır}

Bunu yalnızca normal model gerçekten makulse kullanın. Bu, yararlı bir yaklaşımdır; her gerçek veri kümesi için garanti değildir.

Z-skoru ve çan eğrisiyle çözümlü örnek

Sınav puanlarının şu şekilde modellendiğini varsayalım:

X \sim N(70, 10^2)

Buna göre ortalama puan $70$ , standart sapma ise $10$ 'dur.

Önce ampirik kuralı kullanalım. Puanların yaklaşık $68\%$ 'i ortalamanın bir standart sapma çevresinde olmalıdır:

70 \pm 10

Dolayısıyla hızlı aralık şudur:

60 \text{ ile } 80

Puanların yaklaşık $95\%$ 'i iki standart sapma içinde olmalıdır:

70 \pm 2(10) = 70 \pm 20

Dolayısıyla bu aralık da şöyledir:

50 \text{ ile } 90

Şimdi $85$ alan bir öğrenciyi ele alalım. Z-skoru:

z = \frac{85 - 70}{10} = 1.5

Bu, puanın ortalamanın $1.5$ standart sapma üstünde olduğu anlamına gelir. En hızlı ve yararlı yorum şudur: puan açıkça ortalamanın üstündedir, ama kuyruğun çok uç kısmında değildir.

Normal dağılım sorularında yaygın hatalar

Her çan biçimli grafiği normal sanmak

Bazı veriler çarpık olabilir, kalın kuyruklara sahip olabilir ya da birden fazla tepe içerebilir. Bu durumlarda grafik kabaca yuvarlak görünse bile normal model zayıf bir uyum sağlayabilir.

Yoğunluğu olasılıkla karıştırmak

$f(x)$ formülü, $X$ 'in tek bir kesin sayıya eşit olma olasılığı değildir. Sürekli dağılımlarda tek bir noktanın olasılığı $0$ 'dır; bu yüzden bunun yerine aralıklarla çalışılır.

Modeli kontrol etmeden ampirik kuralı kullanmak

$68$ - $95$ - $99.7$ kuralı normal dağılıma aittir. Her veri kümesine otomatik olarak uygulanmamalıdır.

Varyans ile standart sapmayı karıştırmak

Varyans $\sigma^2$ 'dir. Z-skorunda $\sigma$ kullanılır, $\sigma^2$ değil.

Normal dağılım ne zaman kullanılır?

Normal dağılım, ölçümlerin merkezi bir değer etrafında toplandığı ve uç değerlerin görece seyrek olduğu durumlarda sık görülür. Ölçüm hatası modellerinde, sınav puanlarının yorumlanmasında, kalite kontrolde ve örneklem ortalamalarının incelenmesinde yaygındır.

Bu, tüm gerçek verilerin normal olduğu anlamına gelmez. Anlamı şudur: şekil, bağlam ve varsayımlar bu yaklaşımı makul kıldığında normal model yararlı bir yaklaşımdır.

Benzer bir soru deneyin

Örneği $X \sim N(100, 15^2)$ olacak şekilde değiştirin ve $130$ için z-skorunu hesaplayın. Sonra değerlerin yaklaşık $95\%$ 'ini kapsayan aralığı bulun. Farklı bir ortalama ya da standart sapmayla kendi örneğinizi denemek, çan eğrisinin nasıl değiştiğini görmenin iyi bir yoludur.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →