Koefisien korelasi biasanya merujuk pada koefisien korelasi Pearson, ditulis . Ini mengukur arah dan kekuatan hubungan linear antara dua variabel numerik.
Jika positif, variabel-variabel tersebut cenderung meningkat bersama. Jika negatif, yang satu cenderung menurun saat yang lain meningkat. Jika mendekati , Pearson's menyatakan bahwa pola linearnya kecil, bukan berarti sama sekali tidak ada hubungan.
Pearson's paling berguna ketika data datang dalam pasangan, kedua variabel bersifat numerik, dan tren garis lurus adalah pola yang ingin Anda ringkas.
Apa yang Diberitahukan Koefisien Korelasi
Pearson's adalah ukuran terstandarisasi tentang bagaimana dua variabel berubah bersama. Untuk sampel data berpasangan, rumusnya adalah
Pembilang bernilai positif ketika variabel-variabel cenderung bergerak ke arah yang sama dan bernilai negatif ketika mereka cenderung bergerak ke arah yang berlawanan. Penyebut menskalakan kembali pergerakan bersama itu menggunakan sebaran masing-masing variabel.
Ketika Pearson's terdefinisi, nilainya harus memenuhi
Jika salah satu variabel sama sekali tidak memiliki variasi, penyebut menjadi , sehingga Pearson's tidak terdefinisi.
Cara Menafsirkan Nilai Positif, Negatif, dan Mendekati Nol
Mulailah dari tandanya:
- : asosiasi linear positif
- : asosiasi linear negatif
- : tidak ada asosiasi linear
Lalu perhatikan besarannya . Nilai yang lebih dekat ke berarti titik-titik data lebih dekat pada pola garis lurus. Nilai yang lebih dekat ke berarti pola linearnya lebih lemah.
Berhati-hatilah dengan label seperti "lemah", "sedang", atau "kuat". Batas-batas itu bergantung pada konteks. Di satu bidang, mungkin penting. Di bidang lain, nilainya mungkin terlalu kecil untuk mendukung suatu keputusan.
Kebiasaan yang paling aman adalah membaca bersama diagram pencar. Angka tersebut adalah ringkasan dari pola yang Anda lihat; itu tidak seharusnya menggantikan gambar.
Contoh Hitung: Menghitung
Misalkan data berpasangannya adalah
Pertama hitung rata-ratanya:
Sekarang tuliskan deviasi dari rata-ratanya:
- Untuk :
- Untuk :
Kalikan deviasi yang berpasangan lalu jumlahkan:
Sekarang hitung dua jumlah kuadratnya:
Jadi
Ini memberi tahu Anda bahwa ada asosiasi linear positif yang kuat dalam sampel ini. Saat meningkat, biasanya juga meningkat, dan titik-titiknya akan berada cukup dekat dengan garis yang menanjak.
Kesalahan Umum Saat Menafsirkan Korelasi
Menganggap Korelasi Sebagai Kausalitas
Korelasi yang tinggi tidak membuktikan bahwa satu variabel menyebabkan variabel lainnya. Faktor ketiga mungkin memengaruhi keduanya, atau hubungan itu bisa saja kebetulan dalam data yang diamati.
Lupa Bahwa Pearson's Bersifat Linear
Pearson's hanya mengukur asosiasi linear dengan baik. Hubungan yang melengkung dapat menghasilkan korelasi kecil meskipun variabel-variabelnya jelas saling berhubungan.
Mengabaikan Pencilan
Satu titik yang tidak biasa dapat banyak mengubah . Jika diagram pencar memiliki pencilan, korelasi bisa memberikan gambaran yang menyesatkan tentang pola keseluruhan.
Menggunakan Pearson's Saat Kondisinya Tidak Cocok
Pearson's dirancang untuk data numerik berpasangan dan asosiasi linear. Jika salah satu variabel bersifat kategorikal, atau jika polanya jelas melengkung, koefisien ini mungkin tidak menjawab pertanyaan yang sebenarnya Anda pedulikan.
Membaca Terlalu Jauh Nilai yang Mendekati Nol
Nilai yang mendekati berarti "asosiasi linear kecil", bukan "tidak ada hubungan dalam bentuk apa pun."
Kapan Koefisien Korelasi Pearson Digunakan
Pearson's umum digunakan dalam statistika, sains, ekonomi, penelitian sosial, dan machine learning sebagai ringkasan cepat untuk data numerik berpasangan. Ini paling berguna ketika Anda ingin mengetahui apakah ada pola garis lurus sebelum beralih ke model seperti regresi linear.
Dalam praktiknya, diagram pencar seharusnya dilihat terlebih dahulu. Koefisien ini adalah ringkasan, bukan pengganti untuk melihat datanya secara langsung.
Coba Soal Serupa
Ambil kumpulan data kecil yang sudah Anda pahami, plot titik-titiknya, lalu perkirakan apakah trennya terlihat positif, negatif, atau tidak jelas sebelum menghitung . Perbandingan cepat itu adalah salah satu cara tercepat untuk membangun intuisi tentang apa yang sebenarnya dikatakan oleh koefisien korelasi.
Jika Anda ingin melangkah sedikit lebih jauh, telusuri data yang sama dengan garis regresi linear sederhana. Itu memudahkan Anda melihat bagaimana korelasi dan prediksi saling berhubungan, tetapi tidak identik.
Butuh bantuan mengerjakan soal?
Unggah pertanyaanmu dan dapatkan solusi terverifikasi langkah demi langkah dalam hitungan detik.
Buka GPAI Solver →