Regresyon analizi, bir veya daha fazla yordayıcı değiştikçe sonucun nasıl değiştiğini açıklar. Tek bir yordayıcı ve sayısal bir sonuç için basit doğrusal regresyon, birden fazla yordayıcı ve sayısal bir sonuç için çoklu doğrusal regresyon, geçme/kalma gibi ikili bir sonuç için ise lojistik regresyon kullanılır.
Bu ayrım, en çok aranan soruyu hızlıca yanıtlar:
- Basit doğrusal regresyon: bir yordayıcı, sayısal sonuç.
- Çoklu doğrusal regresyon: birden fazla yordayıcı, sayısal sonuç.
- Lojistik regresyon: evet/hayır, geçti/kaldı veya tıkladı/tıklamadı gibi ikili sonuç.
Bundan sonra asıl iş yorumlamadır. Bir katsayı, ancak model sonuç türüne uyuyorsa ve veriye makul ölçüde iyi uyuyorsa düşündüğünüz anlama gelir.
Regresyon analizi ne yapar
Regresyon sadece noktalardan geçen bir doğru çizmez. Yordayıcıları beklenen sonuca bağlayan bir kural kurar; böylece örüntüleri açıklayabilir veya tahmin yapabilirsiniz.
Doğrusal regresyonda bu kural, sonucun beklenen değeri için doğrusal bir modeldir. Lojistik regresyonda ise model olasılıklar için kurulur; bu yüzden tahmin edilen değerler ile arasında kalır.
Basit doğrusal regresyon: bir yordayıcı, sayısal sonuç
Basit doğrusal regresyon, bir yordayıcı ve bir sayısal sonuç kullanır:
Burada tahmin edilen sonuç, sabit terim ve eğimdir.
Eğim , ilgilendiğiniz aralıkta doğrusal bir örüntü makul bir yaklaşım ise, 'teki bir birimlik artış için 'de beklenen değişimi verir.
Çoklu doğrusal regresyon: birkaç yordayıcı, bir sayısal sonuç
Çoklu doğrusal regresyon aynı temel fikri korur, ancak birden fazla yordayıcı kullanır:
Bu, tek bir yordayıcının tek başına fazla basit kaldığı durumlarda yararlıdır. Gerçek sonuçlar çoğu zaman aynı anda birkaç etkene bağlıdır.
Yorumdaki temel değişiklik önemlidir: , diğer dahil edilen yordayıcılar sabit tutulurken, 'deki bir birimlik artış için 'de beklenen değişimdir.
Diğer yordayıcıları sabit tutma koşulu, çoklu regresyonu tek değişkenli karşılaştırmalar dizisinden ayırır.
Lojistik regresyon: ikili sonuçlar ve olasılıklar
Lojistik regresyon, sayısal değil ikili bir sonuç içindir. Sonuç kabul edildi/edilmedi, ayrıldı/kaldı ya da geçti/kaldı gibi durumlarsa, doğrusal regresyon genellikle yanlış araçtır.
Lojistik regresyon, sonucun kendisini doğrusal bir çizgi olarak modellemek yerine, sonucun log-olasılık oranını modeller:
burada .
Sol taraf log-olasılık oranıdır; olasılığın kendisi değildir. Bu kurulum önemlidir çünkü olasılıkların ile arasında kalması gerekir: sıradan bir doğrusal model ya da gibi imkânsız değerler tahmin edebilir, ama lojistik regresyon edemez.
Çözümlü örnek: puan tahmini ile geçti/kaldı tahmini
Bir öğretmenin öğrenci performansını incelemek istediğini düşünün.
Sonuç sınav puanıysa ve tek yordayıcı çalışma saatiyse, basit doğrusal model şöyle olabilir:
Bir öğrenci saat çalışırsa, tahmin edilen puan
olur.
Burada eğim, doğrusal model makul bir uyum sağlıyorsa, her ek çalışma saati için tahmin edilen puanın puan arttığını söyler.
Şimdi öğretmenin uyku saatini ve çözülen deneme sayısını da eklediğini düşünün. Çoklu regresyon modeli şöyle olabilir:
burada çalışma saati, uyku saati ve tamamlanan deneme sayısıdır.
Buradaki katsayısı artık daha özel bir anlama sahiptir: uyku ve deneme sayısı sabit tutulurken, bir saat daha fazla çalışmanın tahmin edilen puandaki değişimidir.
Şimdi soruyu değiştirelim. Puan tahmin etmek yerine öğretmen, bir öğrencinin geçme olasılığını bilmek istesin. Bu durumda sonuç ikilidir; dolayısıyla doğal seçim lojistik regresyondur:
Bir öğrenci saat çalışıp saat uyursa,
olur; dolayısıyla tahmin edilen olasılık
şeklindedir.
Bu model yaklaşık geçme olasılığı tahmin eder. Kesin sayılar sadece örnektir. Temel fikir şudur: sonuç puandan geçti/kaldıya dönüştüğünde, regresyon ailesi de değişmelidir.
Regresyon analizinde yaygın hatalar
İkili bir sonuç için doğrusal regresyon kullanmak
Sonuç yalnızca veya ise, olasılıklar için tasarlandığından lojistik regresyon genellikle daha uygundur. Doğrusal regresyon bazı özel durumlarda yaklaşık bir yöntem olarak kullanılabilir, ancak zayıf olasılık tahminleri de üretebilir.
Regresyonu nedenselliğin kanıtı gibi görmek
Regresyon ilişkiyi betimleyebilir ve tahmini destekleyebilir. Tek başına, bir değişkeni değiştirmenin sonucun değişmesine neden olduğunu kanıtlamaz.
Model koşullarını göz ardı etmek
Bir katsayı, ancak seçilen model makul bir uyum sağlıyorsa düşündüğünüz anlama gelir. Doğrusal regresyonda bu genellikle doğrusal bir özetin anlamlı olup olmadığını ve hataların modelin kaçırdığı bir örüntü gösterip göstermediğini kontrol etmeyi içerir.
Çoklu regresyon katsayılarını fazla yorumlamak
Çoklu regresyonda bir katsayı, diğer dahil edilen yordayıcılara koşulludur. Önemli değişkenler eksikse ya da yordayıcılar birbirine güçlü biçimde dolanmışsa, yorum daha az kararlı hale gelir.
Regresyon analizi nerelerde kullanılır
Regresyon; değişkenliği açıklamak, koşullu ilişkileri tahmin etmek veya veriden öngörü yapmak istediğinizde kullanılır.
İşletme tahminlerinde, tıpta, sosyal bilimlerde, kalite kontrolde, eğitimde ve makine öğrenmesinde karşınıza çıkar. Kesin biçim sonuca bağlıdır: sayısal sonuçlar çoğu zaman doğrusal modellere, ikili sonuçlar ise çoğu zaman lojistik modellere götürür.
Doğru regresyon modeli nasıl seçilir
Önce şu iki soruyu sorun:
- Sonuç sayısal mı yoksa ikili mi?
- Kaç yordayıcı dahil etmek istiyorum?
Sonuç sayısalsa, doğrusal regresyonla başlayın. Bir yordayıcı varsa bu basit doğrusal regresyondur. Birkaç yordayıcı varsa bu çoklu doğrusal regresyondur.
Sonuç ikiliyse, lojistik regresyonla başlayın.
Bu, modelin iyi olduğunu garanti etmez; ama sizi hızlıca doğru model ailesine götürür.
Benzer bir problem deneyin
Küçük bir veri kümesi alın ve onun hakkında iki farklı soru sorun. Önce puan gibi sayısal bir sonucu tahmin edin. Sonra bu sonucu geçti ya da kaldı gibi ikili bir biçime dönüştürün. Bu yan yana karşılaştırma, regresyon analizini kavramanın en hızlı yollarından biridir.
Bir soruyla yardıma mı ihtiyacın var?
Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.
GPAI Solver Aç →