Koefisien korelasi biasanya merujuk pada koefisien korelasi Pearson, ditulis rr. Ini mengukur arah dan kekuatan hubungan linear antara dua variabel numerik.

Jika rr positif, variabel-variabel tersebut cenderung meningkat bersama. Jika rr negatif, yang satu cenderung menurun saat yang lain meningkat. Jika rr mendekati 00, Pearson's rr menyatakan bahwa pola linearnya kecil, bukan berarti sama sekali tidak ada hubungan.

Pearson's rr paling berguna ketika data datang dalam pasangan, kedua variabel bersifat numerik, dan tren garis lurus adalah pola yang ingin Anda ringkas.

Apa yang Diberitahukan Koefisien Korelasi

Pearson's rr adalah ukuran terstandarisasi tentang bagaimana dua variabel berubah bersama. Untuk sampel data berpasangan, rumusnya adalah

r=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2i=1n(yiyˉ)2r = \frac{\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum_{i=1}^n (x_i-\bar{x})^2 \sum_{i=1}^n (y_i-\bar{y})^2}}

Pembilang bernilai positif ketika variabel-variabel cenderung bergerak ke arah yang sama dan bernilai negatif ketika mereka cenderung bergerak ke arah yang berlawanan. Penyebut menskalakan kembali pergerakan bersama itu menggunakan sebaran masing-masing variabel.

Ketika Pearson's rr terdefinisi, nilainya harus memenuhi

1r1-1 \le r \le 1

Jika salah satu variabel sama sekali tidak memiliki variasi, penyebut menjadi 00, sehingga Pearson's rr tidak terdefinisi.

Cara Menafsirkan Nilai Positif, Negatif, dan Mendekati Nol

Mulailah dari tandanya:

  • r>0r > 0: asosiasi linear positif
  • r<0r < 0: asosiasi linear negatif
  • r=0r = 0: tidak ada asosiasi linear

Lalu perhatikan besarannya r|r|. Nilai yang lebih dekat ke 11 berarti titik-titik data lebih dekat pada pola garis lurus. Nilai yang lebih dekat ke 00 berarti pola linearnya lebih lemah.

Berhati-hatilah dengan label seperti "lemah", "sedang", atau "kuat". Batas-batas itu bergantung pada konteks. Di satu bidang, r=0.3r = 0.3 mungkin penting. Di bidang lain, nilainya mungkin terlalu kecil untuk mendukung suatu keputusan.

Kebiasaan yang paling aman adalah membaca rr bersama diagram pencar. Angka tersebut adalah ringkasan dari pola yang Anda lihat; itu tidak seharusnya menggantikan gambar.

Contoh Hitung: Menghitung r=0.9r = 0.9

Misalkan data berpasangannya adalah

(1,2), (2,3), (3,5), (4,4), (5,6)(1,2),\ (2,3),\ (3,5),\ (4,4),\ (5,6)

Pertama hitung rata-ratanya:

xˉ=1+2+3+4+55=3\bar{x} = \frac{1+2+3+4+5}{5} = 3 yˉ=2+3+5+4+65=4\bar{y} = \frac{2+3+5+4+6}{5} = 4

Sekarang tuliskan deviasi dari rata-ratanya:

  • Untuk xx: 2,1,0,1,2-2, -1, 0, 1, 2
  • Untuk yy: 2,1,1,0,2-2, -1, 1, 0, 2

Kalikan deviasi yang berpasangan lalu jumlahkan:

(2)(2)+(1)(1)+(0)(1)+(1)(0)+(2)(2)=4+1+0+0+4=9(-2)(-2) + (-1)(-1) + (0)(1) + (1)(0) + (2)(2) = 4 + 1 + 0 + 0 + 4 = 9

Sekarang hitung dua jumlah kuadratnya:

(xixˉ)2=4+1+0+1+4=10\sum (x_i-\bar{x})^2 = 4+1+0+1+4 = 10 (yiyˉ)2=4+1+1+0+4=10\sum (y_i-\bar{y})^2 = 4+1+1+0+4 = 10

Jadi

r=91010=910=0.9r = \frac{9}{\sqrt{10 \cdot 10}} = \frac{9}{10} = 0.9

Ini memberi tahu Anda bahwa ada asosiasi linear positif yang kuat dalam sampel ini. Saat xx meningkat, yy biasanya juga meningkat, dan titik-titiknya akan berada cukup dekat dengan garis yang menanjak.

Kesalahan Umum Saat Menafsirkan Korelasi

Menganggap Korelasi Sebagai Kausalitas

Korelasi yang tinggi tidak membuktikan bahwa satu variabel menyebabkan variabel lainnya. Faktor ketiga mungkin memengaruhi keduanya, atau hubungan itu bisa saja kebetulan dalam data yang diamati.

Lupa Bahwa Pearson's rr Bersifat Linear

Pearson's rr hanya mengukur asosiasi linear dengan baik. Hubungan yang melengkung dapat menghasilkan korelasi kecil meskipun variabel-variabelnya jelas saling berhubungan.

Mengabaikan Pencilan

Satu titik yang tidak biasa dapat banyak mengubah rr. Jika diagram pencar memiliki pencilan, korelasi bisa memberikan gambaran yang menyesatkan tentang pola keseluruhan.

Menggunakan Pearson's rr Saat Kondisinya Tidak Cocok

Pearson's rr dirancang untuk data numerik berpasangan dan asosiasi linear. Jika salah satu variabel bersifat kategorikal, atau jika polanya jelas melengkung, koefisien ini mungkin tidak menjawab pertanyaan yang sebenarnya Anda pedulikan.

Membaca Terlalu Jauh Nilai yang Mendekati Nol

Nilai yang mendekati 00 berarti "asosiasi linear kecil", bukan "tidak ada hubungan dalam bentuk apa pun."

Kapan Koefisien Korelasi Pearson Digunakan

Pearson's rr umum digunakan dalam statistika, sains, ekonomi, penelitian sosial, dan machine learning sebagai ringkasan cepat untuk data numerik berpasangan. Ini paling berguna ketika Anda ingin mengetahui apakah ada pola garis lurus sebelum beralih ke model seperti regresi linear.

Dalam praktiknya, diagram pencar seharusnya dilihat terlebih dahulu. Koefisien ini adalah ringkasan, bukan pengganti untuk melihat datanya secara langsung.

Coba Soal Serupa

Ambil kumpulan data kecil yang sudah Anda pahami, plot titik-titiknya, lalu perkirakan apakah trennya terlihat positif, negatif, atau tidak jelas sebelum menghitung rr. Perbandingan cepat itu adalah salah satu cara tercepat untuk membangun intuisi tentang apa yang sebenarnya dikatakan oleh koefisien korelasi.

Jika Anda ingin melangkah sedikit lebih jauh, telusuri data yang sama dengan garis regresi linear sederhana. Itu memudahkan Anda melihat bagaimana korelasi dan prediksi saling berhubungan, tetapi tidak identik.

Butuh bantuan mengerjakan soal?

Unggah pertanyaanmu dan dapatkan solusi terverifikasi langkah demi langkah dalam hitungan detik.

Buka GPAI Solver →