Korelasyon katsayısı denince genellikle Pearson korelasyon katsayısı anlaşılır ve rr ile gösterilir. Bu katsayı, iki sayısal değişken arasındaki doğrusal ilişkinin yönünü ve gücünü ölçer.

rr pozitifse, değişkenler birlikte artma eğilimindedir. rr negatifse, biri artarken diğeri azalma eğilimindedir. rr, 00'a yakınsa Pearson's rr, çok az doğrusal örüntü olduğunu söyler; bu mutlaka hiç ilişki olmadığı anlamına gelmez.

Pearson's rr, en çok veriler eşleştirilmiş olduğunda, her iki değişken de sayısal olduğunda ve özetlemek istediğiniz örüntü doğrusal bir eğilim olduğunda kullanışlıdır.

Korelasyon Katsayısının Size Söyledikleri

Pearson's rr, iki değişkenin birlikte nasıl değiştiğinin standartlaştırılmış bir ölçüsüdür. Eşleştirilmiş örneklem verileri için formül şöyledir:

r=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2i=1n(yiyˉ)2r = \frac{\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum_{i=1}^n (x_i-\bar{x})^2 \sum_{i=1}^n (y_i-\bar{y})^2}}

Pay, değişkenler aynı yönde hareket etme eğilimindeyse pozitiftir; zıt yönde hareket etme eğilimindeyse negatiftir. Payda ise bu ortak hareketi, her bir değişkenin yayılımını kullanarak yeniden ölçeklendirir.

Pearson's rr tanımlı olduğunda şu koşulu sağlamalıdır:

1r1-1 \le r \le 1

Eğer değişkenlerden birinde hiç değişim yoksa, payda 00 olur; bu yüzden Pearson's rr tanımsızdır.

Pozitif, Negatif ve Sıfıra Yakın Değerler Nasıl Yorumlanır?

Önce işarete bakın:

  • r>0r > 0: pozitif doğrusal ilişki
  • r<0r < 0: negatif doğrusal ilişki
  • r=0r = 0: doğrusal ilişki yok

Sonra büyüklüğe, yani r|r| değerine bakın. 11'e daha yakın değerler, noktaların bir doğru örüntüsüne daha yakın kaldığını gösterir. 00'a daha yakın değerler ise doğrusal örüntünün daha zayıf olduğunu gösterir.

"Zayıf", "orta" veya "güçlü" gibi etiketleri kullanırken dikkatli olun. Bu eşikler bağlama bağlıdır. Bir alanda r=0.3r = 0.3 önemli olabilir. Başka bir alanda ise bir kararı desteklemek için fazla küçük kalabilir.

En güvenli alışkanlık, rr değerini bir saçılım grafiğiyle birlikte okumaktır. Bu sayı, gördüğünüz örüntünün bir özetidir; görselin yerini almamalıdır.

Çözümlü Örnek: r=0.9r = 0.9 Hesaplama

Eşleştirilmiş verilerin şöyle olduğunu varsayalım:

(1,2), (2,3), (3,5), (4,4), (5,6)(1,2),\ (2,3),\ (3,5),\ (4,4),\ (5,6)

Önce ortalamaları hesaplayın:

xˉ=1+2+3+4+55=3\bar{x} = \frac{1+2+3+4+5}{5} = 3 yˉ=2+3+5+4+65=4\bar{y} = \frac{2+3+5+4+6}{5} = 4

Şimdi ortalamalardan sapmaları listeleyin:

  • xx için: 2,1,0,1,2-2, -1, 0, 1, 2
  • yy için: 2,1,1,0,2-2, -1, 1, 0, 2

Eşleştirilmiş sapmaları çarpıp toplayın:

(2)(2)+(1)(1)+(0)(1)+(1)(0)+(2)(2)=4+1+0+0+4=9(-2)(-2) + (-1)(-1) + (0)(1) + (1)(0) + (2)(2) = 4 + 1 + 0 + 0 + 4 = 9

Şimdi iki kareler toplamını hesaplayın:

(xixˉ)2=4+1+0+1+4=10\sum (x_i-\bar{x})^2 = 4+1+0+1+4 = 10 (yiyˉ)2=4+1+1+0+4=10\sum (y_i-\bar{y})^2 = 4+1+1+0+4 = 10

Dolayısıyla

r=91010=910=0.9r = \frac{9}{\sqrt{10 \cdot 10}} = \frac{9}{10} = 0.9

Bu, bu örneklemde güçlü bir pozitif doğrusal ilişki olduğunu gösterir. xx arttıkça yy de genellikle artar ve noktalar yukarı eğimli bir doğruya oldukça yakın durur.

Korelasyonu Yorumlarken Yapılan Yaygın Hatalar

Korelasyonu Nedensellik Gibi Görmek

Yüksek bir korelasyon, bir değişkenin diğerine neden olduğunu kanıtlamaz. Üçüncü bir etken her ikisini de etkiliyor olabilir ya da gözlenen verilerdeki ilişki tesadüfi olabilir.

Pearson's rr'nin Doğrusal Olduğunu Unutmak

Pearson's rr, yalnızca doğrusal ilişkiyi iyi ölçer. Eğrisel bir ilişki, değişkenler açıkça ilişkili olsa bile küçük bir korelasyon üretebilir.

Aykırı Değerleri Göz Ardı Etmek

Alışılmadık tek bir nokta, rr değerini çok değiştirebilir. Saçılım grafiğinde bir aykırı değer varsa, korelasyon genel örüntü hakkında yanıltıcı bir hikâye anlatabilir.

Uygun Olmayan Durumlarda Pearson's rr Kullanmak

Pearson's rr, eşleştirilmiş sayısal veriler ve doğrusal ilişki için tasarlanmıştır. Değişkenlerden biri kategorikse ya da örüntü açıkça eğriselse, bu katsayı aslında önem verdiğiniz soruya cevap vermeyebilir.

Sıfıra Yakın Bir Değeri Fazla Yorumlamak

00'a yakın bir değer, "az doğrusal ilişki" anlamına gelir; "hiçbir tür ilişki yok" anlamına gelmez.

Pearson Korelasyon Katsayısı Ne Zaman Kullanılır?

Pearson's rr, istatistikte, bilimde, ekonomide, sosyal araştırmalarda ve makine öğrenmesinde eşleştirilmiş sayısal verilerin hızlı bir özeti olarak yaygın biçimde kullanılır. Özellikle doğrusal regresyon gibi bir modele geçmeden önce, doğrusal bir örüntü olup olmadığını görmek istediğinizde en kullanışlıdır.

Uygulamada önce bir saçılım grafiğine bakılmalıdır. Katsayı bir özettir; veriye bakmanın yerine geçmez.

Benzer Bir Problem Deneyin

Zaten iyi anladığınız küçük bir veri kümesi alın, noktaları grafiğe dökün ve rr'yi hesaplamadan önce eğilimin pozitif, negatif ya da belirsiz görünüp görünmediğini tahmin edin. Bu hızlı karşılaştırma, korelasyon katsayısının gerçekte ne söylediğine dair sezgi geliştirmenin en hızlı yollarından biridir.

Bir adım daha ileri gitmek isterseniz, aynı veriyi basit bir doğrusal regresyon doğrusu ile inceleyin. Bu, korelasyon ile tahminin nasıl ilişkili olduğunu, ama aynı şey olmadığını görmeyi kolaylaştırır.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →