İstatistikte veri türleri, bir değişkenin neyi temsil ettiğini gösterir. Değerler "kırmızı" ya da "biyoloji" gibi etiketlerse veri niteldir. Değerler sayısal miktarlarsa veri niceldir. Nicel veriler için genelde bir soru daha sorulur: bu veri kesikli bir sayım mı, yoksa sürekli bir ölçüm mü?

Bu ayrım önemlidir çünkü veri türü, hangi grafiklerin, özetlerin ve modellerin anlamlı olduğunu etkiler. Ortalama, boy uzunlukları için yararlı olabilir ama göz rengi için olmaz.

Nitel ve nicel veri

Nitel veri kategorileri ifade eder

Nitel veri, sayısal miktarlardan çok özellikleri, grupları veya etiketleri açıklar. Araba rengi, kan grubu ve ülke buna örnektir.

Bu veri türüne sıkça kategorik veri de denir.

Nicel veri sayısal miktarları ifade eder

Nicel veri, sayısal bir miktarı kaydeder. Sayı sadece bir etiket değildir; ne kadar, kaç tane ya da ne kadar uzak olduğunu gösterir.

Yaş, boy, sınav puanı ve evcil hayvan sayısı buna örnektir.

Kesikli ve sürekli veri

Kesikli veri saymadan gelir

Kesikli veri, genellikle sayma ile elde edilen nicel veridir. Değerler, tüm bir aralığı doldurmak yerine bir izinli değerden diğerine sıçrar.

Bir sınıftaki öğrenci sayısı kesiklidir çünkü tam öğrenci sayarsınız. Normal bir sayma modelinde 24.524.5 öğrenci gibi değerler anlamlı değildir.

Sürekli veri ölçmeden gelir

Sürekli veri, genellikle ölçme ile elde edilen nicel veridir. İlke olarak değer, kullanılan ölçüm aracına ve bağlama göre giderek daha hassas biçimde kaydedilebilir.

Boy, zaman ve sıcaklık standart örneklerdir. Bir kişinin boyu, kullanılan hassasiyete göre 170170 cm, 170.2170.2 cm veya 170.24170.24 cm olarak yazılabilir.

Çözümlü örnek: öğrenci verilerini sınıflandırma

Bir okulun her öğrenci için şu dört değişkeni kaydettiğini düşünün:

  • sınıf şubesi
  • kardeş sayısı
  • okula ulaşım süresi
  • en sevdiği ders

Bunları şöyle sınıflandırırız.

Sınıf şubesi nitel veridir çünkü bir grup etiketidir.

Kardeş sayısı nicel ve kesiklidir çünkü bir sayımdır: 0,1,2,3,0, 1, 2, 3, vb.

Okula ulaşım süresi nicel ve süreklidir çünkü ölçülür. En yakın dakikaya yuvarlayabilirsiniz ama alttaki değişken bundan daha ince biçimde değişebilir.

En sevdiği ders nitel veridir çünkü bir miktarı değil, bir kategoriyi adlandırır.

Bu örnek temel karar yolunu gösterir. Önce "etiket mi, miktar mı?" diye sorun. Eğer miktarsa, "sayım mı, ölçüm mü?" diye sorun.

Hangi veri türüne sahip olduğunuzu nasıl anlarsınız

Şu pratik kuralı kullanın:

  1. Değerlerin ortalamasını almak anlamsızsa veri muhtemelen niteldir.
  2. Ortalama almak anlamlıysa veri muhtemelen niceldir.
  3. Nicel değerler ayrı nesneleri saymaktan geliyorsa genelde kesiklidir.
  4. Bir ölçek üzerinde ölçmekten geliyorsa genelde süreklidir.

Bu, resmi bir kanıt değil, pratik bir kestirme yoldur. Değişkenin bağlamı yine de önemlidir.

İstatistikte veri türleriyle ilgili yaygın hatalar

Sayısal kodları gerçek miktarlar sanmak

Anket cevapları 11, 22 ve 33 olarak kodlanmışsa, bu sayılar yine de gerçek miktarlar yerine kategorileri temsil ediyor olabilir. Veride sayı bulunması, değişkeni otomatik olarak nicel yapmaz.

Her tam sayı değerin kesikli olduğunu varsaymak

Kaydedilmiş bir ölçüm, sadece yuvarlandığı için tam sayı gibi görünebilir. Örneğin 6868, 7272 ve 7575 kilogram olarak listelenen ağırlıklar, ağırlık sayılmadı da ölçüldüyse yine sürekli veridir.

Değişkeni, saklanma biçimiyle karıştırmak

En yakın dakikaya yuvarlanan ulaşım süresi çoğu zaman tam sayılar olarak saklanır ama değişkenin kendisi yine süreklidir. Kayıt biçimi, alttaki türü her zaman değiştirmez.

Bu veri türleri istatistikte nerelerde kullanılır

Sınıflandırma, bir grafik, özet ya da istatistiksel yöntem seçtiğiniz her durumda önemlidir.

Nitel veriler için sütun grafikleri ve frekans tabloları yaygındır. Nicel veriler için histogramlar, kutu grafikleri, ortalama, ortanca ve standart sapma yararlı olabilir.

Kesikli-sürekli ayrımı, bir olasılık modeli seçerken de önemlidir. Bazı modeller sayımlar için, bazıları ise sürekli bir aralık üzerindeki ölçümler için kurulmuştur.

Kendi örneğinizi deneyin

Ayakkabı numarası, posta kodu, sıcaklık, e-posta sayısı veya saç rengi gibi günlük hayattan beş değişken seçin ve her birini sınıflandırın. Bir durum belirsiz geliyorsa, değerin etiket, sayım ya da ölçüm olmasına göre hangi koşulun belirleyici olduğunu belirtin.

Bir adım daha ileri gitmek isterseniz, her değişken için hangi grafik ya da özetin anlamlı olduğunu ve hangisinin olmadığını sorarak başka bir durumu inceleyin.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →