Uji Chi Square | GPAI STEM

Uji chi square memeriksa apakah data hitungan kategorikal menyimpang terlalu jauh dari yang diharapkan model hanya karena kebetulan. Uji ini digunakan untuk jumlah dalam kategori, bukan untuk rata-rata atau pengukuran mentah.

Gagasan intinya sederhana: bandingkan apa yang diamati dengan apa yang diharapkan jika hipotesis nol benar. Jika selisihnya cukup besar, statistik chi square menjadi besar, dan data tersebut menjadi bukti yang menentang model nol itu.

Apa yang Sebenarnya Dibandingkan oleh Uji Ini

Dalam pengaturan yang paling umum, Anda memiliki hitungan teramati $O$ dan hitungan harapan $E$ untuk setiap kategori. Statistik ujinya adalah

\chi^2 = \sum \frac{(O - E)^2}{E}

Nilai ini menjadi lebih besar ketika hitungan teramati makin jauh dari hitungan harapan. Ketidaksesuaian yang lebih besar memberi pengaruh lebih besar, dan kategori dengan hitungan harapan yang lebih besar diskalakan sesuai rumus.

Hitungan harapan tidak ditebak sembarangan. Nilai itu berasal dari hipotesis nol. Untuk uji kesesuaian, hipotesis nol bisa menyatakan bahwa semua kategori memiliki peluang yang sama. Untuk uji independensi, hipotesis nol menyatakan bahwa dua variabel kategorikal tidak saling berhubungan.

Dua Versi yang Umum

Istilah "uji chi square" biasanya merujuk pada salah satu dari berikut ini:

Uji kesesuaian, yang menanyakan apakah satu variabel kategorikal mengikuti distribusi yang diklaim.
Uji independensi, yang menanyakan apakah dua variabel kategorikal saling berasosiasi dalam tabel kontingensi.

Keluarga statistik yang sama digunakan pada kedua kasus, tetapi cara menghitung hitungan harapan bergantung pada versinya.

Contoh Hitung: Uji Kesesuaian

Misalkan sebuah kafe ingin mengetahui apakah tiga ukuran minuman dipilih sama seringnya. Dari $60$ pesanan, hitungan teramatinya adalah:

Kecil: $26$
Sedang: $18$
Besar: $16$

Jika hipotesis nol menyatakan bahwa ketiga ukuran sama-sama mungkin dipilih, maka hitungan harapan pada setiap kategori adalah

E = \frac{60}{3} = 20

Sekarang hitung statistiknya:

\chi^2 = \frac{(26-20)^2}{20} + \frac{(18-20)^2}{20} + \frac{(16-20)^2}{20}

= \frac{36}{20} + \frac{4}{20} + \frac{16}{20}

= 1.8 + 0.2 + 0.8 = 2.8

Itu adalah statistik uji, bukan kesimpulan akhir dengan sendirinya. Anda akan membandingkan $\chi^2 = 2.8$ dengan distribusi chi square dengan derajat kebebasan yang sesuai. Di sini derajat kebebasannya adalah $3 - 1 = 2$ , karena ada tiga kategori dan tidak ada parameter yang diestimasi dari data. Dengan $df = 2$ , statistik sebesar $2.8$ bukan bukti yang kuat untuk menolak preferensi yang sama pada taraf $5\%$ .

Pembacaan praktisnya adalah: hitungan tersebut memang berbeda dari kesamaan sempurna, tetapi belum cukup besar untuk dengan yakin mengatakan bahwa preferensi sebenarnya tidak sama hanya berdasarkan sampel ini.

Kapan Uji Ini Masuk Akal

Gunakan uji chi square ketika semua hal berikut benar:

Data Anda berupa sekumpulan hitungan dalam kategori.
Pengamatannya saling independen, atau cukup mendekati independen untuk model yang Anda gunakan.
Hitungan harapan tidak terlalu kecil untuk pendekatan chi square yang ingin Anda pakai.

Dalam banyak pengantar statistika, orang memakai aturan praktis bahwa hitungan harapan sebaiknya setidaknya sekitar $5$ pada setiap kategori. Ini adalah pedoman praktis, bukan hukum universal, tetapi tetap merupakan tanda peringatan yang berguna.

Kesalahan yang Sering Terjadi

Menggunakan uji ini pada mean, pengukuran, atau persentase alih-alih hitungan kategori.
Menganggap hitungan teramati sebagai hitungan harapan. Hitungan harapan harus berasal dari hipotesis nol.
Mengabaikan hitungan harapan yang kecil, yang dapat membuat pendekatan chi square biasa menjadi tidak andal.
Mengira "signifikan secara statistik" berarti "penting dalam praktik." Uji ini hanya membahas bukti terhadap model nol.

Di Mana Uji Ini Digunakan

Uji chi square muncul dalam survei, genetika, pengendalian mutu, riset pasar, dan situasi apa pun ketika hasil masuk ke dalam kategori. Uji ini sangat umum ketika pertanyaan sebenarnya adalah apakah suatu pola mengejutkan atau apakah dua variabel kategorikal tampak saling berhubungan.

Jika datanya numerik, bukan kategorikal, biasanya alat lain lebih tepat. Misalnya, membandingkan mean sering mengarah ke uji $t$ atau ANOVA.

Coba Versi Anda Sendiri

Ambil sebuah tabel kecil berisi hitungan kategori dan tuliskan hipotesis nol sebelum melakukan perhitungan apa pun. Langkah tunggal ini biasanya mencegah kesalahan terbesar dalam soal chi square: memakai rumus yang benar dengan hitungan harapan yang salah.

Butuh bantuan mengerjakan soal?

Unggah pertanyaanmu dan dapatkan solusi terverifikasi langkah demi langkah dalam hitungan detik.

Buka GPAI Solver →