Dağılım ölçüleri, bir veri kümesinin ne kadar yayıldığını gösterir. Üç temel ölçü açıklık, varyans ve standart sapmadır. Açıklık yalnızca en küçük ve en büyük değerleri kullanır, varyans ortalamadan olan kareli uzaklıkların ortalamasını ölçer ve standart sapma varyansın karekökü olduğu için yayılımı yeniden orijinal birimlere taşır.

Hızlı bir özet istiyorsanız, çabuk bir bakış için açıklığı, biçimsel istatistiksel çalışmalar için varyansı ve yorumlaması daha kolay bir yayılım ölçüsü istediğinizde standart sapmayı kullanın.

Açıklık, varyans ve standart sapmaya kısa bakış

Açıklık, minimum ile maksimum arasındaki farktır:

range=maximumminimum\text{range} = \text{maximum} - \text{minimum}

Hızlı hesaplanır, ama yalnızca iki değeri kullanır. Tek bir uç değer onu büyük ölçüde değiştirebilir.

Varyans, değerlerin ortalamadan ne kadar uzakta bulunma eğiliminde olduğunu, bu uzaklıklar karesi alındıktan sonra ölçer.

Bir anakütlenin tamamı için,

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

Daha büyük bir anakütleyi tahmin etmek için kullanılan bir örneklem için,

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

Veriniz ilgilendiğiniz anakütlenin tamamıysa yalnızca NN kullanın. Veriniz daha büyük bir grubun örneklemiyse n1n-1 kullanın.

Standart sapma, varyansın kareköküdür:

σ=σ2\sigma = \sqrt{\sigma^2}

ya da bir örneklem için,

s=s2s = \sqrt{s^2}

Orijinal birimlerde ifade edildiği için standart sapmayı okumak genellikle varyanstan daha kolaydır.

Çözümlü örnek: aynı açıklık, farklı yayılım

Şu iki veri kümesini karşılaştırın:

  • Küme A: 2,5,5,5,82, 5, 5, 5, 8
  • Küme B: 2,2,5,8,82, 2, 5, 8, 8

Her ikisinin de minimumu, maksimumu ve ortalaması aynıdır.

Her bir küme için,

range=82=6\text{range} = 8 - 2 = 6

ve

mean=255=5\text{mean} = \frac{25}{5} = 5

Yani yalnızca açıklığa bakarsak ikisi de eşit genişlikte görünür. Ama değerler ortalama etrafında farklı biçimde dizilmiştir.

Küme A

Ortalamadan sapmalar şöyledir:

3, 0, 0, 0, 3-3,\ 0,\ 0,\ 0,\ 3

Bunların kareleri:

9, 0, 0, 0, 99,\ 0,\ 0,\ 0,\ 9

Kareli sapmaların toplamı 1818'dir. Veriyi anakütle olarak ele alırsak,

σ2=185=3.6\sigma^2 = \frac{18}{5} = 3.6

ve

σ=3.61.90\sigma = \sqrt{3.6} \approx 1.90

Küme B

Ortalamadan sapmalar şöyledir:

3, 3, 0, 3, 3-3,\ -3,\ 0,\ 3,\ 3

Bunların kareleri:

9, 9, 0, 9, 99,\ 9,\ 0,\ 9,\ 9

Kareli sapmaların toplamı 3636 olduğundan,

σ2=365=7.2\sigma^2 = \frac{36}{5} = 7.2

ve

σ=7.22.68\sigma = \sqrt{7.2} \approx 2.68

Her iki kümenin açıklığı aynı olsa da Küme B'nin varyansı ve standart sapması daha büyüktür. Temel fikir budur: açıklık yalnızca uç noktaları görür, varyans ve standart sapma ise tüm veri kümesini kullanır.

Dağılım ölçülerinde yaygın hatalar

Yaygın bir hata, aynı açıklığın aynı yayılım anlamına geldiğini sanmaktır. Yukarıdaki örnek bunun neden yanlış olduğunu gösterir.

Bir başka hata, varyansı orijinal birimlerdeymiş gibi düşünmektir. Öyle değildir. Veri metre cinsindeyse varyans metrekare cinsindedir.

Üçüncü bir hata da anakütle ve örneklem formüllerini karıştırmaktır. Doğru payda duruma bağlıdır: anakütlenin tamamı için NN, örneklem için n1n-1 kullanın.

Ayrıca, büyük sapmalar ortalama alınmadan önce karesi alındığı için varyans ve standart sapmanın aykırı değerlere duyarlı olduğunu hatırlamak da yararlıdır.

Hangi ölçü ne zaman kullanışlıdır?

Verinin ne kadar geniş bir aralıkta değiştiğine hızlıca bakmak istediğinizde açıklığı kullanın.

Yayılım ölçüsüne başka istatistiksel yöntemlerin içinde ihtiyaç duyduğunuzda varyansı kullanın. Olasılık ve istatistikte birçok formül, raporlarda sonradan standart sapma verilse bile, varyans üzerine kuruludur.

Veriyle aynı birimlerde pratik bir yayılım açıklaması istediğinizde standart sapmayı kullanın. Sınıf içi ve gerçek yaşam özetlerinin çoğunda en kolay okunabilen seçenek budur.

Benzer bir soru deneyin

Aynı ortalamaya ve aynı açıklığa sahip iki kısa veri kümesi oluşturun, sonra bunların varyansını ve standart sapmasını karşılaştırın. Bir sonraki adım olarak, elle çözdükten sonra kendi sürümünüzü bir çözücüde deneyin.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →