Regresi linear adalah cara untuk menggambarkan bagaimana satu variabel berubah terhadap variabel lain dengan menggunakan garis lurus terbaik. Dalam regresi linear sederhana, dengan satu variabel input dan satu variabel output , modelnya adalah
Di sini adalah nilai prediksi, adalah kemiringan, dan adalah intersep. Metode fitting yang umum digunakan adalah kuadrat terkecil biasa, yang memilih garis yang membuat residual kuadrat sekecil mungkin:
Jika Anda hanya membutuhkan gagasan utamanya, ingat ini: kemiringan menunjukkan perubahan prediksi pada untuk kenaikan satu satuan pada , selama model garis lurus merupakan kecocokan yang masuk akal.
Persamaan Regresi Linear: Apa yang Diberitahukannya
Kemiringan menunjukkan perubahan prediksi pada ketika naik sebesar , jika model linear merupakan gambaran yang masuk akal untuk data. Intersep adalah nilai prediksi dari saat .
Kata "prediksi" itu penting. Garis regresi biasanya tidak melalui setiap titik. Sebaliknya, garis ini menyeimbangkan galat di semua titik, sehingga merangkum tren alih-alih mencocokkan setiap pengamatan.
Rumus Regresi Linear untuk dan
Untuk regresi linear sederhana, jika nilai-nilai tidak semuanya sama, koefisien kuadrat terkecil dapat ditulis sebagai
dan
Di sini adalah rata-rata nilai dan adalah rata-rata nilai . Rumus-rumus ini berlaku untuk regresi linear sederhana. Jika Anda memiliki lebih dari satu variabel input, susunannya berubah.
Mengapa Kuadrat Terkecil Menggunakan Residual Kuadrat
Bayangkan titik-titik data sebagai sekumpulan titik pada diagram pencar. Banyak garis lurus bisa lewat dekat kumpulan titik itu. Regresi linear memilih garis yang menjaga selisih vertikal, yang disebut residual, tetap kecil secara keseluruhan.
Mengkuadratkan residual memberi dua manfaat. Pertama, ini mencegah galat positif dan negatif saling meniadakan. Kedua, ini memberi bobot lebih besar pada selisih yang besar.
Contoh Regresi Linear Sederhana
Misalkan titik-titik datanya adalah , , , dan . Kita akan menyesuaikan sebuah garis regresi linear sederhana.
Pertama, cari rata-ratanya:
Sekarang hitung kemiringannya:
Lalu hitung intersepnya:
Jadi persamaan regresinya adalah
Jika , model memprediksi
Anda juga dapat memeriksa satu residual. Saat , nilai prediksinya adalah
Nilai aktualnya adalah , jadi residualnya adalah
Titik itu berada satuan di bawah garis regresi. Satu residual tidak memberi tahu apakah seluruh model itu baik, tetapi ini menunjukkan bagaimana regresi mengukur galat.
Kesalahan Umum dalam Regresi Linear
Salah satu kesalahan adalah menganggap garis harus melalui setiap titik. Regresi membahas kecocokan terbaik, bukan kecocokan sempurna.
Kesalahan lain adalah membaca kemiringan sebagai aturan yang tepat untuk setiap titik data. Kemiringan adalah perubahan prediksi rata-rata dari model.
Kesalahan ketiga adalah menganggap regresi sebagai bukti kausalitas. Pola linear yang kuat dapat mendukung prediksi atau menggambarkan hubungan, tetapi tidak dengan sendirinya menjelaskan mengapa variabel-variabel itu bergerak bersama.
Juga mudah untuk terlalu percaya pada prediksi di luar rentang data yang diamati. Ekstrapolasi bisa gagal bahkan ketika garis hasil fitting tampak baik di dalam rentang aslinya.
Kapan Menggunakan Regresi Linear
Regresi linear digunakan ketika ringkasan garis lurus berguna dan hubungan antarvariabel setidaknya kira-kira linear pada rentang yang Anda pedulikan. Penggunaan umum mencakup memperkirakan harga dari ukuran, nilai dari waktu belajar, atau output dari input dalam kondisi yang stabil.
Metode ini sangat berguna ketika Anda menginginkan model yang mudah ditafsirkan. Kemiringan, intersep, dan residual cukup sederhana untuk dijelaskan tanpa menyembunyikan apa yang dilakukan model.
Pemeriksaan Cepat Sebelum Mempercayai Garis
Sebelum menggunakan garis regresi, ajukan dua pertanyaan. Apakah diagram pencar terlihat kira-kira linear? Apakah konteksnya membuat kemiringan itu bermakna, bukan menyesatkan? Jika salah satu jawabannya tidak, model lain mungkin lebih baik.
Coba Soal Serupa
Pilih empat titik, buat sketsanya, lalu sesuaikan sebuah garis dengan kalkulator atau perangkat lunak. Setelah itu, bandingkan nilai prediksi dengan nilai aktual. Melihat residual sering kali merupakan cara tercepat untuk memahami apa yang sebenarnya dilakukan garis regresi.
Butuh bantuan mengerjakan soal?
Unggah pertanyaanmu dan dapatkan solusi terverifikasi langkah demi langkah dalam hitungan detik.
Buka GPAI Solver →