Doğrusal regresyon, bir değişkenin diğeriyle birlikte nasıl değiştiğini en iyi uyum sağlayan bir doğru kullanarak açıklama yöntemidir. Bir giriş değişkeni xx ve bir çıkış değişkeni yy içeren basit doğrusal regresyonda model şöyledir:

y^=b0+b1x\hat{y} = b_0 + b_1x

Burada y^\hat{y} tahmin edilen değer, b1b_1 eğim ve b0b_0 sabit terimdir. En yaygın uyum yöntemi, karesi alınmış artıkların mümkün olduğunca küçük olmasını sağlayan en küçük kareler yöntemidir:

i=1n(yiy^i)2=i=1n(yi(b0+b1xi))2\sum_{i=1}^n \left(y_i - \hat{y}_i\right)^2 = \sum_{i=1}^n \left(y_i - (b_0 + b_1x_i)\right)^2

Yalnızca ana fikri bilmeniz gerekiyorsa şunu hatırlayın: Doğrusal model makul bir uyum sağladığı sürece eğim, xx'teki bir birimlik artış için modelin yy'de öngördüğü değişimi verir.

Doğrusal Regresyon Denklemi: Size Ne Söyler?

Doğrusal model veriyi makul biçimde açıklıyorsa, eğim b1b_1, xx değeri 11 arttığında yy'de beklenen değişimi gösterir. Sabit terim b0b_0 ise x=0x = 0 iken yy'nin tahmin edilen değeridir.

Buradaki "tahmin edilen" sözcüğü önemlidir. Regresyon doğrusu genellikle her noktadan geçmez. Bunun yerine tüm noktalar üzerindeki hataları dengeler; yani her gözleme tam uymaktan çok genel eğilimi özetler.

b0b_0 ve b1b_1 İçin Doğrusal Regresyon Formülü

Basit doğrusal regresyonda, xx değerleri birbirinin aynısı değilse, en küçük kareler katsayıları şu şekilde yazılabilir:

b1=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2b_1 = \frac{\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})}{\sum_{i=1}^n (x_i-\bar{x})^2}

ve

b0=yˉb1xˉb_0 = \bar{y} - b_1\bar{x}

Burada xˉ\bar{x}, xx değerlerinin ortalaması; yˉ\bar{y} ise yy değerlerinin ortalamasıdır. Bu formüller basit doğrusal regresyon içindir. Birden fazla giriş değişkeniniz varsa kurulum değişir.

En Küçük Kareler Neden Artıkların Karesini Kullanır?

Veri noktalarını bir saçılım grafiğindeki nokta bulutu gibi düşünün. Bu bulutun yakınından geçen birçok doğru çizilebilir. Doğrusal regresyon, artık adı verilen dikey sapmaları genel olarak küçük tutan doğruyu seçer.

Artıkların karesini almak iki yararlı şey yapar. Pozitif ve negatif hataların birbirini götürmesini engeller ve büyük sapmalara daha fazla ağırlık verir.

Basit Doğrusal Regresyon Örneği

Veri noktalarının (1,2)(1,2), (2,2)(2,2), (3,4)(3,4) ve (4,4)(4,4) olduğunu varsayalım. Bu verilere basit bir doğrusal regresyon doğrusu uyduralım.

Önce ortalamaları bulalım:

xˉ=1+2+3+44=2.5\bar{x} = \frac{1+2+3+4}{4} = 2.5 yˉ=2+2+4+44=3\bar{y} = \frac{2+2+4+4}{4} = 3

Şimdi eğimi hesaplayalım:

b1=(1.5)(1)+(0.5)(1)+(0.5)(1)+(1.5)(1)(1.5)2+(0.5)2+(0.5)2+(1.5)2b_1 = \frac{(-1.5)(-1)+(-0.5)(-1)+(0.5)(1)+(1.5)(1)}{(-1.5)^2+(-0.5)^2+(0.5)^2+(1.5)^2} b1=45=0.8b_1 = \frac{4}{5} = 0.8

Ardından sabit terimi hesaplayalım:

b0=yˉb1xˉ=30.8(2.5)=1b_0 = \bar{y} - b_1\bar{x} = 3 - 0.8(2.5) = 1

Buna göre regresyon denklemi şöyledir:

y^=1+0.8x\hat{y} = 1 + 0.8x

Eğer x=5x=5 ise model şu tahmini yapar:

y^=1+0.8(5)=5\hat{y} = 1 + 0.8(5) = 5

Bir artığı da kontrol edebilirsiniz. x=2x=2 iken tahmin edilen değer şöyledir:

y^=1+0.8(2)=2.6\hat{y} = 1 + 0.8(2) = 2.6

Gerçek değer 22 olduğuna göre artık:

yy^=22.6=0.6y-\hat{y} = 2 - 2.6 = -0.6

Bu nokta, regresyon doğrusunun 0.60.6 birim altında kalır. Tek bir artık, modelin genel olarak iyi olup olmadığını göstermez; ancak regresyonun hatayı nasıl ölçtüğünü gösterir.

Doğrusal Regresyonda Yaygın Hatalar

Yaygın hatalardan biri, doğrunun her noktadan geçmesi gerektiğini sanmaktır. Regresyon kusursuz uyumla değil, en iyi uyumla ilgilidir.

Bir başka hata, eğimi her veri noktası için kesin bir kural gibi okumaktır. Eğim, modelin verdiği ortalama tahmini değişimi gösterir.

Üçüncü bir hata da regresyonu nedenselliğin kanıtı olarak görmektir. Güçlü bir doğrusal örüntü tahmini destekleyebilir veya ilişkiyi tanımlayabilir, ancak değişkenlerin neden birlikte hareket ettiğini tek başına açıklamaz.

Gözlenen veri aralığının dışındaki tahminlere gereğinden fazla güvenmek de kolaydır. Uydurulan doğru, özgün aralıkta iyi görünse bile dışa taşırma başarısız olabilir.

Doğrusal Regresyon Ne Zaman Kullanılır?

Doğrusal regresyon, doğrusal bir özetin yararlı olduğu ve ilişkinin ilgilendiğiniz aralıkta en azından yaklaşık olarak doğrusal olduğu durumlarda kullanılır. Yaygın kullanım alanları arasında büyüklükten fiyat tahmini, çalışma süresinden puan tahmini veya sabit koşullarda girdiden çıktı tahmini yer alır.

Özellikle yorumlanabilir bir model istediğinizde çok kullanışlıdır. Eğim, sabit terim ve artıklar; modelin ne yaptığını gizlemeden açıklanabilecek kadar basittir.

Doğruya Güvenmeden Önce Hızlı Bir Kontrol

Bir regresyon doğrusunu kullanmadan önce iki soru sorun. Saçılım grafiği yaklaşık olarak doğrusal görünüyor mu? Bağlam, eğimi yanıltıcı değil anlamlı kılıyor mu? Bu sorulardan birine hayır diyorsanız, başka bir model daha iyi olabilir.

Benzer Bir Soru Deneyin

Dört nokta seçin, bunların kabaca grafiğini çizin ve hesap makinesi ya da yazılımla bir doğru uydurun. Sonra tahmin edilen değerleri gerçek değerlerle karşılaştırın. Artıklara bakmak, regresyon doğrusunun gerçekte ne yaptığını anlamanın çoğu zaman en hızlı yoludur.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →