Kovaryans — Formül, Anlamı ve Korelasyondan Farkı

Kovaryans, iki değişkenin ortalamalarının üstünde ya da altında birlikte olma eğiliminde olup olmadığını ölçer. Pozitif kovaryans, değişkenlerin ortalamalarına göre genellikle aynı yönde hareket ettiğini gösterir. Negatif kovaryans ise biri ortalamanın üstündeyken diğerinin ortalamanın altında olma eğiliminde olduğunu gösterir.

Çoğu öğrenci için temel fikir şudur: işaret, ham sayıdan genellikle daha kullanışlıdır. Kovaryansın büyüklüğü her iki değişkenin birimlerine bağlıdır, bu yüzden tek başına temiz bir ilişki gücü ölçeği değildir.

Örneklem ve Popülasyon İçin Kovaryans Formülü

Eşleştirilmiş verilerden oluşan bir örneklem için yaygın bir formül şudur:

s_{xy} = \frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})

Burada $\bar{x}$ ve $\bar{y}$ örneklem ortalamalarıdır. Her bir $(x_i-\bar{x})(y_i-\bar{y})$ çarpımı, çift her iki ortalamanın da aynı tarafına düştüğünde pozitiftir; zıt taraflara düştüğünde ise negatiftir.

Bir örneklem yerine tam bir popülasyonla çalışıyorsanız, payda genellikle $n-1$ yerine $N$ olur:

\mathrm{Cov}(X,Y) = \frac{1}{N}\sum_{i=1}^N (x_i-\mu_x)(y_i-\mu_y)

Örneklem verileri için örneklem sürümünü kullanın; popülasyon sürümünü ise yalnızca veriler tanımlamak istediğiniz tüm popülasyonu temsil ettiğinde kullanın.

Kovaryansın İşareti Nasıl Yorumlanır?

Kovaryans, ortalamadan olan eşleştirilmiş sapmalardan oluşur.

Her iki sapma da pozitifse, çarpımları pozitiftir. Her ikisi de negatifse, çarpımları yine pozitiftir. Bu çiftler kovaryansı yukarı iter, çünkü değişkenler merkezlerine göre birlikte hareket etmektedir.

Bir sapma pozitif, diğeri negatifse çarpım negatiftir. Bu çiftler kovaryansı aşağı çeker, çünkü değişkenler zıt yönlerde hareket etmektedir.

Yani kovaryans aslında “ortalama etrafındaki ortak hareketin” ortalamasıdır.

Çözümlü Örnek: Çalışma Saatleri ve Kısa Sınav Puanları

Küçük bir örneklemde çalışma saatleri ile kısa sınav puanlarının kaydedildiğini varsayalım:

(1,70),\ (2,80),\ (3,90)

Önce ortalamaları bulun:

\bar{x} = \frac{1+2+3}{3} = 2

\bar{y} = \frac{70+80+90}{3} = 80

Şimdi sapmaları ve bunların çarpımlarını hesaplayın:

$(1,70)$ için: $(1-2)(70-80) = (-1)(-10) = 10$
$(2,80)$ için: $(2-2)(80-80) = 0$
$(3,90)$ için: $(3-2)(90-80) = (1)(10) = 10$

Çarpımları toplayın:

10 + 0 + 10 = 20

Bu örneklem kovaryansı olduğu için $n-1 = 2$ 'ye bölün:

s_{xy} = \frac{20}{2} = 10

Kovaryans pozitiftir, yani bu örneklemde değişkenler birlikte hareket etmektedir. Burada daha fazla çalışma süresi, daha yüksek kısa sınav puanlarıyla birlikte görülmektedir.

Önemli uyarı şu ki $10$ , evrensel bir ilişki gücü ölçeği değildir. Büyüklüğü burada kullanılan birimlere bağlıdır: saat çarpı puan. Ölçüm ölçeğini değiştirirseniz, genel örüntü benzer kalsa bile kovaryans da değişir.

Kovaryans ve Korelasyon: Temel Fark

Kovaryans ve korelasyon yakından ilişkilidir, ancak biraz farklı sorulara cevap verirler.

Kovaryans, ortak hareketin yönünü söyler ve özgün ölçeği korur. Korelasyon ise standart sapmalar sıfır değilse, kovaryansı standart sapmalara bölerek bu ilişkiyi standartlaştırır:

r = \frac{s_{xy}}{s_x s_y}

Bu yüzden korelasyon birimsizdir ve farklı veri kümeleri arasında karşılaştırması daha kolaydır. Değeri $-1$ ile $1$ arasında kalır; kovaryansın ise sabit bir aralığı yoktur.

Pratikte:

Değişkenlerin özgün birimlerindeki ortak değişimi önemsiyorsanız ya da kovaryans matrisi gibi daha büyük bir hesaplamanın içinde yer alıyorsa kovaryansı kullanın.
Veri kümeleri arasında karşılaştırması daha kolay olan birimsiz bir özet istiyorsanız korelasyonu kullanın.

Kovaryansla İlgili Yaygın Hatalar

Büyük Bir Kovaryansı Otomatik Olarak Güçlü Sanmak

$100$ değerindeki bir kovaryans, $5$ değerindeki bir kovaryanstan otomatik olarak daha “güçlü” değildir. Değişkenler yalnızca daha büyük ölçeklerde ölçülüyor olabilir.

Örneklem ve Popülasyon Formüllerini Karıştırmak

Veriniz bir örneklemse, $n-1$ 'e bölmek standarttır. Veriniz ilgilenilen tüm popülasyonu kapsıyorsa, $N$ 'ye bölmek popülasyon sürümüdür.

Sıfır Kovaryansın Hiçbir İlişki Olmadığını Sanmak

$0$ 'a yakın bir kovaryans, ortalamalar etrafında çok az doğrusal ortak hareket olduğunu gösterir. Doğrusal olmayan bir ilişkiyi dışlamaz.

İki değişken bağımsızsa ve kovaryans tanımlıysa, kovaryans $0$ olur. Tersi ise her zaman doğru değildir.

Kovaryansı Nedensellik Gibi Okumak

Kovaryans yalnızca değişkenlerin birlikte nasıl değiştiğini açıklar. Neden birlikte değiştiklerini açıklamaz.

Kovaryans Ne Zaman Kullanılır?

Kovaryans; istatistik, finans, makine öğrenmesi ve veri analizinde, eşleştirilmiş değişkenlerin birlikte incelenmesi gerektiğinde kullanılır.

Özellikle kovaryans matrislerinde yaygındır; burada her bir giriş, iki değişkenin birlikte nasıl değiştiğini özetler. Bu; portföy riski, temel bileşen analizi ve çok değişkenli modelleme gibi alanlarda önemlidir.

Benzer Bir Soru Deneyin

Herhangi üç ya da dört eşleştirilmiş değer alın, iki ortalamayı hesaplayın, sonra eşleştirilmiş sapmaları çarpıp ortalamasını bulun. Bu tek işlem dizisi, kovaryansın işaretini çok daha somut hale getirir.

Bir sonraki adımı görmek isterseniz, aynı veriyi korelasyon katsayısı ile karşılaştırın ve ölçekleri standartlaştırmanın yorumu nasıl değiştirdiğine dikkat edin.

Sıkça Sorulan Sorular

Kovaryans neyi ölçer?: Kovaryans, iki değişkenin ortalamalarının üstünde birlikte mi, ortalamalarının altında birlikte mi olduklarını ya da zıt yönlerde mi hareket ettiklerini ölçer.
Kovaryans negatif olabilir mi?: Evet. Negatif kovaryans, bir değişkenin yüksek değerlerinin, ortalamalarına göre diğer değişkenin düşük değerleriyle birlikte görülme eğiliminde olduğunu gösterir.
Kovaryans ile korelasyon arasındaki fark nedir?: Kovaryans, özgün birimleri ve ölçeği korur; korelasyon ise ilişkiyi standartlaştırır, böylece sonuç birimsiz olur ve veri kümeleri arasında karşılaştırmak daha kolay hale gelir.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →