Jenis data dalam statistika menunjukkan apa yang direpresentasikan oleh suatu variabel. Jika nilainya berupa label seperti "merah" atau "biologi", datanya kualitatif. Jika nilainya berupa besaran numerik, datanya kuantitatif. Lalu, untuk data kuantitatif, biasanya ada satu pertanyaan lagi: apakah itu hitungan diskrit atau pengukuran kontinu?
Hal ini penting karena jenis data memengaruhi grafik, ringkasan, dan model statistik yang masuk akal untuk digunakan. Rata-rata bisa berguna untuk tinggi badan, tetapi tidak untuk warna mata.
Data kualitatif vs kuantitatif
Data kualitatif berarti kategori
Data kualitatif menggambarkan sifat, kelompok, atau label, bukan besaran numerik. Contohnya meliputi warna mobil, golongan darah, dan negara.
Jenis data ini juga sering disebut data kategorik.
Data kuantitatif berarti besaran numerik
Data kuantitatif mencatat suatu besaran numerik. Angka tersebut bukan sekadar label; angka itu menunjukkan seberapa banyak, berapa jumlahnya, atau seberapa jauh.
Contohnya meliputi usia, tinggi badan, nilai ujian, dan jumlah hewan peliharaan.
Data diskrit vs kontinu
Data diskrit berasal dari menghitung
Data diskrit adalah data kuantitatif yang biasanya berasal dari menghitung. Nilainya meloncat dari satu nilai yang diperbolehkan ke nilai lain, bukan mengisi seluruh suatu interval.
Jumlah siswa dalam satu kelas bersifat diskrit karena Anda menghitung siswa utuh. Dalam model perhitungan biasa, nilai seperti siswa tidak masuk akal.
Data kontinu berasal dari mengukur
Data kontinu adalah data kuantitatif yang biasanya berasal dari mengukur. Secara prinsip, nilainya dapat dicatat dengan ketelitian yang semakin halus, tergantung pada alat ukur dan konteksnya.
Tinggi badan, waktu, dan suhu adalah contoh yang umum. Tinggi seseorang bisa ditulis sebagai cm, cm, atau cm tergantung pada tingkat ketelitian yang digunakan.
Contoh pembahasan: mengklasifikasikan data siswa
Misalkan sebuah sekolah mencatat empat variabel berikut untuk setiap siswa:
- kelas wali
- jumlah saudara kandung
- waktu tempuh ke sekolah
- mata pelajaran favorit
Berikut cara mengklasifikasikannya.
Kelas wali bersifat kualitatif karena merupakan label kelompok.
Jumlah saudara kandung bersifat kuantitatif dan diskrit karena merupakan hitungan: dan seterusnya.
Waktu tempuh ke sekolah bersifat kuantitatif dan kontinu karena diukur. Anda mungkin membulatkannya ke menit terdekat, tetapi variabel dasarnya dapat bervariasi lebih halus daripada itu.
Mata pelajaran favorit bersifat kualitatif karena menyatakan kategori, bukan besaran.
Contoh ini menunjukkan alur keputusan utamanya. Pertama, tanyakan "label atau besaran?" Jika itu besaran, tanyakan "hitungan atau pengukuran?"
Cara menentukan jenis data yang Anda miliki
Gunakan aturan praktis berikut:
- Jika menghitung rata-ratanya tidak bermakna, datanya kemungkinan kualitatif.
- Jika menghitung rata-ratanya masuk akal, datanya kemungkinan kuantitatif.
- Jika nilai kuantitatif berasal dari menghitung objek yang terpisah, biasanya data itu diskrit.
- Jika nilainya berasal dari pengukuran pada suatu skala, biasanya data itu kontinu.
Ini adalah jalan pintas praktis, bukan bukti formal. Konteks variabel tetap penting.
Kesalahan umum tentang jenis data dalam statistika
Menganggap kode angka sebagai besaran nyata
Jika jawaban survei diberi kode , , dan , angka-angka itu mungkin tetap mewakili kategori, bukan besaran yang sebenarnya. Adanya angka dalam data tidak otomatis membuat variabel tersebut kuantitatif.
Menganggap setiap nilai bilangan bulat pasti diskrit
Suatu hasil pengukuran bisa tampak sebagai bilangan bulat hanya karena telah dibulatkan. Misalnya, berat badan yang ditulis sebagai , , dan kilogram tetap merupakan data kontinu jika berat diukur, bukan dihitung.
Mencampuradukkan variabel dengan cara penyimpanannya
Waktu tempuh yang dibulatkan ke menit terdekat sering disimpan sebagai bilangan bulat, tetapi variabelnya sendiri tetap kontinu. Format pencatatan tidak selalu mengubah jenis dasarnya.
Di mana jenis data ini digunakan dalam statistika
Klasifikasi ini penting setiap kali Anda memilih grafik, ringkasan, atau metode statistik.
Untuk data kualitatif, diagram batang dan tabel frekuensi umum digunakan. Untuk data kuantitatif, histogram, box plot, rata-rata, median, dan simpangan baku bisa berguna.
Pemisahan antara diskrit dan kontinu juga penting saat memilih model probabilitas. Beberapa model dibuat untuk hitungan, sedangkan yang lain dibuat untuk pengukuran pada suatu kontinum.
Coba versi Anda sendiri
Ambil lima variabel dari kehidupan sehari-hari, seperti ukuran sepatu, kode pos, suhu, jumlah email, atau warna rambut, lalu klasifikasikan masing-masing. Jika ada kasus yang terasa ambigu, nyatakan kondisi yang menentukannya, misalnya apakah nilainya berupa label, hitungan, atau pengukuran.
Jika ingin melangkah lebih jauh, telusuri kasus lain dengan menanyakan grafik atau ringkasan mana yang masuk akal untuk setiap variabel dan mana yang tidak.
Butuh bantuan mengerjakan soal?
Unggah pertanyaanmu dan dapatkan solusi terverifikasi langkah demi langkah dalam hitungan detik.
Buka GPAI Solver →