Una distribuzione di frequenza è una tabella o un grafico che mostra quante volte compare ciascun valore, categoria o intervallo in un insieme di dati. Se i dati sono molti, i valori vicini vengono spesso raggruppati in intervalli di classe, e il conteggio in ogni intervallo è la frequenza.

È utile perché i dati grezzi spesso sono difficili da leggere rapidamente. Una distribuzione di frequenza rende subito visibile il modello: dove i valori si concentrano, dove diventano più rari e quali risultati sono più comuni.

Tabella di distribuzione di frequenza vs. tabella raggruppata

Per dati non raggruppati, la tabella può elencare ogni valore separatamente. Se i punteggi sono 4,5,5,6,6,64, 5, 5, 6, 6, 6, la frequenza di 66 è 33 perché compare tre volte.

Per insiemi di dati numerici più grandi, i valori esatti vengono spesso raggruppati in intervalli come 4040-4949, 5050-5959 e 6060-6969. Questa versione si chiama distribuzione di frequenza raggruppata.

Come funzionano gli intervalli di classe

Un intervallo di classe è un intervallo usato per raccogliere valori vicini in un unico gruppo. In una buona tabella raggruppata, ogni osservazione rientra in una sola classe e le classi non si sovrappongono.

Se usi intervalli come 1010-1919, 2020-2929 e 3030-3939, un valore come 2424 appartiene a una sola classe. Questa regola chiara è importante. Se i limiti delle classi si sovrappongono, la tabella diventa ambigua.

L’ampiezza di classe è la dimensione di ogni intervallo. Se le classi sono 1010-1919, 2020-2929 e 3030-3939, l’ampiezza è costante. Questo conta quando disegni un istogramma: confrontare direttamente l’altezza delle barre è corretto solo quando le ampiezze delle classi sono uguali.

Esempio svolto: leggere una distribuzione di frequenza

Supponiamo che un insegnante registri i punteggi di un quiz di 2020 studenti e li raggruppi in intervalli:

Intervallo di punteggio Frequenza
00-99 22
1010-1919 55
2020-2929 88
3030-3939 44
4040-4949 11

L’intervallo 2020-2929 ha la frequenza più alta, quindi è la fascia di punteggio più comune. Questo non significa che tutti gli studenti abbiano ottenuto lo stesso numero. Significa che 88 studenti hanno ottenuto un punteggio compreso in quell’intervallo.

Le frequenze sommate danno anche il numero totale di studenti:

2+5+8+4+1=202 + 5 + 8 + 4 + 1 = 20

Se vuoi una proporzione invece di un conteggio, usa la frequenza relativa:

relative frequency=frequencytotal number of observations\text{relative frequency} = \frac{\text{frequency}}{\text{total number of observations}}

Per l’intervallo 2020-2929, la frequenza relativa è:

820=0.4\frac{8}{20} = 0.4

Quindi il 40%40\% degli studenti ha ottenuto un punteggio tra 2020 e 2929.

Grafici della distribuzione di frequenza: grafico a barre o istogramma?

Una distribuzione di frequenza può essere mostrata come tabella, grafico a barre o istogramma. Il grafico giusto dipende dal tipo di dati che hai.

Usa un grafico a barre quando stai contando categorie separate, come i frutti preferiti o i tipi di trasporto. Le barre sono separate perché le categorie sono distinte.

Usa un istogramma quando raggruppi dati numerici in intervalli. Le barre si toccano perché gli intervalli rappresentano una scala continua.

Se tutti gli intervalli di classe hanno la stessa ampiezza, barre più alte nell’istogramma indicano frequenze maggiori. Se le ampiezze delle classi sono diverse, la sola altezza può essere fuorviante. In quel caso, l’istogramma dovrebbe usare la densità di frequenza, così è l’area della barra, non solo l’altezza, a rappresentare la frequenza.

Errori comuni nelle tabelle di distribuzione di frequenza

Confondere categorie e intervalli

Un grafico a barre per categorie e un istogramma per dati numerici raggruppati non significano la stessa cosa. Usare il grafico sbagliato può nascondere la struttura dei dati.

Usare classi sovrapposte

Gli intervalli devono seguire una regola chiara. Una struttura come 00-1010 e 1010-2020 è problematica, a meno che tu non dica esattamente a quale intervallo appartiene il valore 1010.

Dimenticare che il raggruppamento nasconde dettagli

Una distribuzione di frequenza raggruppata riassume i dati, ma non conserva ogni valore originale. Quando i punteggi vengono raccolti in intervalli, puoi vedere più facilmente il modello, ma perdi un po’ di precisione.

Confrontare barre di ampiezza diversa come se fossero uguali

Se un intervallo di classe è largo il doppio di un altro, un istogramma non va letto nello stesso modo di un istogramma con classi di uguale ampiezza. La condizione è importante: classi di uguale ampiezza permettono il confronto diretto delle altezze; classi di ampiezza diversa no.

Quando si usano le distribuzioni di frequenza

Le distribuzioni di frequenza sono comuni in statistica, a scuola, nei sondaggi, nel controllo qualità e nel lavoro di laboratorio. Sono particolarmente utili quando l’elenco grezzo è abbastanza lungo da non mostrare più chiaramente il modello con una rapida occhiata.

Sono anche il punto di partenza per idee collegate come gli istogrammi, la frequenza cumulata, le medie raggruppate e le stime della dispersione.

Prova un esercizio simile

Prendi da 1515 a 2020 numeri da un foglio di esercizi, un esperimento o un elenco di punteggi. Prima costruisci una tabella di frequenza non raggruppata, poi raggruppa gli stessi dati in intervalli di classe. Confrontare le due versioni è uno dei modi più rapidi per capire cosa ti aiuta a notare una distribuzione di frequenza e quali dettagli il raggruppamento nasconde.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →