La frequenza cumulata è il totale progressivo in una tabella di frequenza. Indica quante osservazioni sono pari o inferiori a un valore o a un confine di classe, ed è per questo utile per trovare mediana, quartili e percentili.

Un’ogiva è il grafico di questo totale progressivo. Quando sai leggere insieme la tabella e il grafico, gli esercizi con dati raggruppati diventano molto più semplici.

Definizione di frequenza cumulata

Se le frequenze di classe sono f1,f2,,fkf_1, f_2, \dots, f_k, allora la frequenza cumulata fino alla classe kk è

Fk=f1+f2++fkF_k = f_1 + f_2 + \cdots + f_k

Ogni riga aggiunge una classe in più al totale. Se la frequenza cumulata è 2828 alla fine di una classe, allora 2828 osservazioni si trovano in quella classe o in una classe precedente.

Per dati non raggruppati, la frequenza cumulata è semplicemente un conteggio progressivo. Per dati raggruppati, è un conteggio progressivo per intervallo di classe.

Come un’ogiva aiuta a leggere i percentili

Un’ogiva rappresenta la frequenza cumulata rispetto ai confini di classe. Per dati continui raggruppati, di solito si rappresentano:

  • il confine superiore della classe sull’asse orizzontale
  • la frequenza cumulata sull’asse verticale

Poi si uniscono i punti con una linea liscia o spezzata. La curva cresce perché la frequenza cumulata non diminuisce mai.

L’uso principale di un’ogiva è leggere le posizioni nel set di dati ordinato. Se la frequenza totale è NN, allora:

  • la mediana è circa il valore in posizione N/2N/2
  • il primo quartile è circa il valore in posizione N/4N/4
  • il terzo quartile è circa il valore in posizione 3N/43N/4
  • il percentile pp-esimo è circa il valore in posizione (p/100)N(p/100)N

Sul grafico, si parte da quella posizione verticale, ci si sposta orizzontalmente fino all’ogiva e poi si scende sull’asse orizzontale per stimare il valore.

Esempio svolto: mediana e 75° percentile

Supponiamo che i punteggi di un test per 4040 studenti siano raggruppati così:

Punteggio Frequenza Frequenza cumulata
0-10 22 22
10-20 55 77
20-30 99 1616
30-40 1212 2828
40-50 88 3636
50-60 44 4040

La frequenza totale è N=40N = 40.

Trova la mediana dalla tabella

La mediana è il valore in posizione N/2=20N/2 = 20.

Osserva le frequenze cumulate:

  • fino a 20-30, il totale è 1616
  • fino a 30-40, il totale è 2828

Quindi il 2020º valore si trova nella classe 3030-4040.

Se vuoi una stima con dati raggruppati, usa l’interpolazione solo se è ragionevole considerare i valori distribuiti in modo abbastanza uniforme in quella classe. Allora

medianL+N/2Fbeforefw\text{median} \approx L + \frac{N/2 - F_{\text{before}}}{f} \cdot w

Qui:

  • L=30L = 30 è il confine inferiore della classe
  • Fbefore=16F_{\text{before}} = 16 è la frequenza cumulata prima della classe
  • f=12f = 12 è la frequenza della classe
  • w=10w = 10 è l’ampiezza della classe

Quindi

median30+20161210=30+401233.3\text{median} \approx 30 + \frac{20 - 16}{12} \cdot 10 = 30 + \frac{40}{12} \approx 33.3

Questa stima non è esatta. Dipende dall’ipotesi che i valori all’interno della classe 3030-4040 siano distribuiti in modo abbastanza regolare.

Stima il 75° percentile

Il 7575° percentile è il valore in posizione (75/100)40=30(75/100) \cdot 40 = 30.

Dalle frequenze cumulate:

  • fino a 30-40, il totale è 2828
  • fino a 40-50, il totale è 3636

Quindi il 3030º valore si trova nella classe 4040-5050.

Usando la stessa idea di interpolazione,

P7540+3028810=42.5P_{75} \approx 40 + \frac{30 - 28}{8} \cdot 10 = 42.5

Su un’ogiva, segneresti 3030 sull’asse della frequenza cumulata, ti sposteresti orizzontalmente fino alla curva e poi leggeresti verso il basso fino a circa 42.542.5 sull’asse dei punteggi.

Errori comuni con la frequenza cumulata

Confondere frequenza e frequenza cumulata

La frequenza indica quante osservazioni ci sono in una singola classe. La frequenza cumulata indica quante osservazioni ci sono in quella classe e in tutte le classi precedenti insieme.

Usare la posizione sbagliata

Per la mediana o un percentile, la posizione deriva dalla frequenza totale NN. Se usi il totale sbagliato, anche tutti i passaggi successivi saranno errati.

Considerare esatte le stime da dati raggruppati

Un’ogiva o l’interpolazione forniscono una stima all’interno di una classe, non un valore originale esatto dei dati. Questa stima dipende da come i dati sono distribuiti all’interno dell’intervallo.

Rappresentare i valori sbagliati sull’asse orizzontale

Per dati raggruppati, le ogive si rappresentano di solito rispetto ai confini di classe, soprattutto quelli superiori. Rappresentarle rispetto ai punti medi delle classi ne cambia il significato.

Quando si usa la frequenza cumulata

La frequenza cumulata si usa ogni volta che serve la posizione ordinata in un insieme di dati, invece dei soli conteggi classe per classe. Questo include riassunti dei punteggi d’esame, distribuzioni di reddito, dati di controllo qualità e qualsiasi situazione in cui percentili o mediane contano più dei conteggi dei singoli intervalli.

È particolarmente utile quando i dati grezzi sono molti e una tabella raggruppata è più facile da leggere di un lungo elenco di osservazioni.

Prova un esercizio simile sulla frequenza cumulata

Prendi una piccola tabella raggruppata qualsiasi e aggiungi una colonna di frequenza cumulata prima di disegnare un’ogiva. Poi leggi la mediana e un percentile dal grafico e confrontali con la stima ottenuta dalla tabella.

Se vuoi un’ulteriore verifica, prova una tua versione con N=50N = 50 e chiediti dove cadrebbero il 2020º, il 2525º e il 4545º valore. È un modo semplice per fissare bene l’idea.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →