I tipi di dati in statistica indicano che cosa rappresenta una variabile. Se i valori sono etichette come "rosso" o "biologia", i dati sono qualitativi. Se i valori sono quantità numeriche, i dati sono quantitativi. Poi, per i dati quantitativi, di solito si pone un'altra domanda: si tratta di un conteggio discreto o di una misurazione continua?
Questo è importante perché il tipo di dato influisce su quali grafici, riassunti e modelli hanno senso. La media può essere utile per le altezze, ma non per il colore degli occhi.
Dati qualitativi vs quantitativi
I dati qualitativi indicano categorie
I dati qualitativi descrivono qualità, gruppi o etichette invece di quantità numeriche. Alcuni esempi sono il colore dell'auto, il gruppo sanguigno e il paese.
Questo tipo di dati è spesso chiamato anche dato categorico.
I dati quantitativi indicano quantità numeriche
I dati quantitativi registrano una quantità numerica. Il numero non è solo un'etichetta; rappresenta quanto, quanti o quanto lontano.
Esempi comuni sono età, altezza, punteggio di un test e numero di animali domestici.
Dati discreti vs continui
I dati discreti derivano dal conteggio
I dati discreti sono dati quantitativi che di solito derivano dal conteggio. I valori passano da un valore ammesso a un altro invece di riempire un intero intervallo.
Il numero di studenti in una classe è discreto perché si contano studenti interi. In un normale modello di conteggio, valori come studenti non hanno senso.
I dati continui derivano dalla misurazione
I dati continui sono dati quantitativi che di solito derivano dalla misurazione. In linea di principio, il valore può essere registrato con una precisione sempre maggiore, a seconda dello strumento di misura e del contesto.
Altezza, tempo e temperatura sono esempi classici. L'altezza di una persona può essere scritta come cm, cm o cm a seconda della precisione usata.
Esempio svolto: classificare i dati degli studenti
Supponiamo che una scuola registri queste quattro variabili per ogni studente:
- classe
- numero di fratelli e sorelle
- tempo di percorrenza per andare a scuola
- materia preferita
Ecco come classificarle.
Classe è qualitativa perché è un'etichetta di gruppo.
Numero di fratelli e sorelle è quantitativa e discreta perché è un conteggio: e così via.
Tempo di percorrenza per andare a scuola è quantitativa e continua perché viene misurata. Si può arrotondare al minuto più vicino, ma la variabile sottostante può variare in modo più fine.
Materia preferita è qualitativa perché indica una categoria, non una quantità.
Questo esempio mostra il principale percorso decisionale. Per prima cosa chiediti: "etichetta o quantità?" Se è una quantità, chiediti: "conteggio o misurazione?"
Come capire quale tipo di dato hai
Usa questa regola pratica:
- Se fare la media dei valori non avrebbe senso, i dati sono probabilmente qualitativi.
- Se fare la media avrebbe senso, i dati sono probabilmente quantitativi.
- Se i valori quantitativi derivano dal conteggio di elementi separati, di solito sono discreti.
- Se derivano da una misurazione su una scala, di solito sono continui.
Questa è una scorciatoia pratica, non una dimostrazione formale. Il contesto della variabile conta comunque.
Errori comuni sui tipi di dati in statistica
Trattare codici numerici come quantità reali
Se le risposte di un sondaggio sono codificate come , e , quei numeri possono comunque rappresentare categorie invece di quantità reali. La presenza di un numero nei dati non rende automaticamente quantitativa la variabile.
Supporre che ogni valore intero sia discreto
Una misurazione registrata può apparire come un numero intero solo perché è stata arrotondata. Per esempio, pesi indicati come , e chilogrammi sono comunque dati continui se il peso è stato misurato e non contato.
Confondere la variabile con il modo in cui viene memorizzata
Il tempo di percorrenza arrotondato al minuto più vicino viene spesso memorizzato come numero intero, ma la variabile in sé resta continua. Il formato di registrazione non cambia sempre il tipo sottostante.
Dove si usano questi tipi di dati in statistica
La classificazione conta ogni volta che scegli un grafico, un riassunto o un metodo statistico.
Per i dati qualitativi sono comuni i grafici a barre e le tabelle di frequenza. Per i dati quantitativi possono essere utili istogrammi, box plot, medie, mediane e deviazioni standard.
La distinzione tra discreto e continuo conta anche quando scegli un modello di probabilità. Alcuni modelli sono costruiti per i conteggi, mentre altri sono costruiti per misurazioni su un continuo.
Prova con una tua versione
Prendi cinque variabili della vita quotidiana, come numero di scarpe, CAP, temperatura, numero di email o colore dei capelli, e classifica ciascuna. Se un caso ti sembra ambiguo, indica la condizione che decide, per esempio se il valore è un'etichetta, un conteggio o una misurazione.
Se vuoi fare un passo in più, analizza un altro caso chiedendoti quale grafico o riassunto ha senso per ogni variabile e quale invece no.
Hai bisogno di aiuto con un problema?
Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.
Apri GPAI Solver →