Distribuzione di frequenza — Tabelle, grafici e intervalli di classe

Una distribuzione di frequenza è una tabella o un grafico che mostra quante volte compare ciascun valore, categoria o intervallo in un insieme di dati. Se i dati sono molti, i valori vicini vengono spesso raggruppati in intervalli di classe, e il conteggio in ogni intervallo è la frequenza.

È utile perché i dati grezzi spesso sono difficili da leggere rapidamente. Una distribuzione di frequenza rende subito visibile il modello: dove i valori si concentrano, dove diventano più rari e quali risultati sono più comuni.

Tabella di distribuzione di frequenza vs. tabella raggruppata

Per dati non raggruppati, la tabella può elencare ogni valore separatamente. Se i punteggi sono $4, 5, 5, 6, 6, 6$ , la frequenza di $6$ è $3$ perché compare tre volte.

Per insiemi di dati numerici più grandi, i valori esatti vengono spesso raggruppati in intervalli come $40$ - $49$ , $50$ - $59$ e $60$ - $69$ . Questa versione si chiama distribuzione di frequenza raggruppata.

Come funzionano gli intervalli di classe

Un intervallo di classe è un intervallo usato per raccogliere valori vicini in un unico gruppo. In una buona tabella raggruppata, ogni osservazione rientra in una sola classe e le classi non si sovrappongono.

Se usi intervalli come $10$ - $19$ , $20$ - $29$ e $30$ - $39$ , un valore come $24$ appartiene a una sola classe. Questa regola chiara è importante. Se i limiti delle classi si sovrappongono, la tabella diventa ambigua.

L’ampiezza di classe è la dimensione di ogni intervallo. Se le classi sono $10$ - $19$ , $20$ - $29$ e $30$ - $39$ , l’ampiezza è costante. Questo conta quando disegni un istogramma: confrontare direttamente l’altezza delle barre è corretto solo quando le ampiezze delle classi sono uguali.

Esempio svolto: leggere una distribuzione di frequenza

Supponiamo che un insegnante registri i punteggi di un quiz di $20$ studenti e li raggruppi in intervalli:

Intervallo di punteggio	Frequenza
$0$ - $9$	$2$
$10$ - $19$	$5$
$20$ - $29$	$8$
$30$ - $39$	$4$
$40$ - $49$	$1$

L’intervallo $20$ - $29$ ha la frequenza più alta, quindi è la fascia di punteggio più comune. Questo non significa che tutti gli studenti abbiano ottenuto lo stesso numero. Significa che $8$ studenti hanno ottenuto un punteggio compreso in quell’intervallo.

Le frequenze sommate danno anche il numero totale di studenti:

2 + 5 + 8 + 4 + 1 = 20

Se vuoi una proporzione invece di un conteggio, usa la frequenza relativa:

\text{relative frequency} = \frac{\text{frequency}}{\text{total number of observations}}

Per l’intervallo $20$ - $29$ , la frequenza relativa è:

\frac{8}{20} = 0.4

Quindi il $40\%$ degli studenti ha ottenuto un punteggio tra $20$ e $29$ .

Grafici della distribuzione di frequenza: grafico a barre o istogramma?

Una distribuzione di frequenza può essere mostrata come tabella, grafico a barre o istogramma. Il grafico giusto dipende dal tipo di dati che hai.

Usa un grafico a barre quando stai contando categorie separate, come i frutti preferiti o i tipi di trasporto. Le barre sono separate perché le categorie sono distinte.

Usa un istogramma quando raggruppi dati numerici in intervalli. Le barre si toccano perché gli intervalli rappresentano una scala continua.

Se tutti gli intervalli di classe hanno la stessa ampiezza, barre più alte nell’istogramma indicano frequenze maggiori. Se le ampiezze delle classi sono diverse, la sola altezza può essere fuorviante. In quel caso, l’istogramma dovrebbe usare la densità di frequenza, così è l’area della barra, non solo l’altezza, a rappresentare la frequenza.

Errori comuni nelle tabelle di distribuzione di frequenza

Confondere categorie e intervalli

Un grafico a barre per categorie e un istogramma per dati numerici raggruppati non significano la stessa cosa. Usare il grafico sbagliato può nascondere la struttura dei dati.

Usare classi sovrapposte

Gli intervalli devono seguire una regola chiara. Una struttura come $0$ - $10$ e $10$ - $20$ è problematica, a meno che tu non dica esattamente a quale intervallo appartiene il valore $10$ .

Dimenticare che il raggruppamento nasconde dettagli

Una distribuzione di frequenza raggruppata riassume i dati, ma non conserva ogni valore originale. Quando i punteggi vengono raccolti in intervalli, puoi vedere più facilmente il modello, ma perdi un po’ di precisione.

Confrontare barre di ampiezza diversa come se fossero uguali

Se un intervallo di classe è largo il doppio di un altro, un istogramma non va letto nello stesso modo di un istogramma con classi di uguale ampiezza. La condizione è importante: classi di uguale ampiezza permettono il confronto diretto delle altezze; classi di ampiezza diversa no.

Quando si usano le distribuzioni di frequenza

Le distribuzioni di frequenza sono comuni in statistica, a scuola, nei sondaggi, nel controllo qualità e nel lavoro di laboratorio. Sono particolarmente utili quando l’elenco grezzo è abbastanza lungo da non mostrare più chiaramente il modello con una rapida occhiata.

Sono anche il punto di partenza per idee collegate come gli istogrammi, la frequenza cumulata, le medie raggruppate e le stime della dispersione.

Prova un esercizio simile

Prendi da $15$ a $20$ numeri da un foglio di esercizi, un esperimento o un elenco di punteggi. Prima costruisci una tabella di frequenza non raggruppata, poi raggruppa gli stessi dati in intervalli di classe. Confrontare le due versioni è uno dei modi più rapidi per capire cosa ti aiuta a notare una distribuzione di frequenza e quali dettagli il raggruppamento nasconde.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →