Un diagramma a scatola e baffi, chiamato anche box plot, mostra dove si concentra un insieme di dati e quanto è disperso. Evidenzia la mediana, il 50%50\% centrale dei dati e i valori vicini agli estremi, così puoi capire rapidamente la forma generale della distribuzione.

I riferimenti principali sono il primo quartile Q1Q_1, la mediana, il terzo quartile Q3Q_3 e l'intervallo interquartile IQR=Q3Q1IQR = Q_3 - Q_1. C'è però una condizione importante fin da subito: i quartili non sono definiti da un'unica regola universale. Se la tua classe, il tuo libro di testo o il tuo software usa un metodo specifico per i quartili, mantieni lo stesso metodo dall'inizio alla fine.

Cosa mostra a colpo d'occhio un diagramma a scatola e baffi

La scatola va da Q1Q_1 a Q3Q_3, quindi contiene il 50%50\% centrale dei dati. La linea all'interno della scatola è la mediana.

I baffi mostrano fin dove si estendono i dati oltre la scatola. In alcuni diagrammi arrivano al minimo e al massimo. In altri, si fermano ai valori più estremi che non vengono considerati valori anomali. Devi conoscere questa regola prima di decidere cosa rappresentano i baffi.

Come funzionano i quartili e l'IQR

L'intervallo interquartile misura la dispersione della metà centrale dei dati:

IQR=Q3Q1IQR = Q_3 - Q_1

Un IQRIQR più grande significa che la metà centrale è più dispersa. Un IQRIQR più piccolo significa che i dati sono più raggruppati.

Come disegnare un diagramma a scatola e baffi passo dopo passo

Usa sempre lo stesso ordine:

  1. Ordina i dati dal più piccolo al più grande.
  2. Trova la mediana.
  3. Trova Q1Q_1 e Q3Q_3 usando la convenzione sui quartili che ti viene richiesta.
  4. Disegna una retta numerica e segna Q1Q_1, la mediana e Q3Q_3.
  5. Disegna la scatola da Q1Q_1 a Q3Q_3 e la linea della mediana al suo interno.
  6. Aggiungi i baffi usando la regola prevista dalla tua classe o dal software.

Esempio svolto: trovare i quartili per un diagramma a scatola e baffi

Parti dal seguente insieme di dati ordinati

2, 4, 5, 7, 8, 9, 12, 15, 182,\ 4,\ 5,\ 7,\ 8,\ 9,\ 12,\ 15,\ 18

Ci sono 99 valori, quindi la mediana è il quinto valore:

median=8\text{median} = 8

Per questo esempio, usa la regola comune in classe che esclude la mediana complessiva quando si trovano la metà inferiore e quella superiore.

La metà inferiore è

2, 4, 5, 72,\ 4,\ 5,\ 7

quindi

Q1=4+52=4.5Q_1 = \frac{4 + 5}{2} = 4.5

La metà superiore è

9, 12, 15, 189,\ 12,\ 15,\ 18

quindi

Q3=12+152=13.5Q_3 = \frac{12 + 15}{2} = 13.5

Ora calcola l'intervallo interquartile:

IQR=13.54.5=9IQR = 13.5 - 4.5 = 9

Questo fornisce i riferimenti principali della scatola:

Q1=4.5,median=8,Q3=13.5Q_1 = 4.5,\quad \text{median} = 8,\quad Q_3 = 13.5

Se i baffi arrivano al minimo e al massimo, si estendono fino a 22 e 1818. Quindi la scatola va da 4.54.5 a 13.513.5, la linea della mediana si trova a 88 e l'intero diagramma va da 22 a 1818.

Come leggere rapidamente un diagramma a scatola e baffi

Inizia dalla mediana per individuare il centro dei dati.

Poi controlla la larghezza della scatola. Una scatola stretta significa che la metà centrale è molto concentrata. Una scatola larga significa che è più dispersa.

Infine, confronta i baffi e la posizione della mediana all'interno della scatola. Se un lato è visibilmente più lungo, la distribuzione potrebbe essere più estesa da quel lato.

Errori comuni con i diagrammi a scatola e baffi

Non saltare il passaggio dell'ordinamento. Se i dati non sono in ordine, la mediana e i quartili saranno sbagliati.

Non dare per scontato che ogni diagramma usi la stessa regola per i quartili o per i baffi. Due diagrammi corretti possono apparire diversi se sono stati costruiti con convenzioni differenti.

Non interpretare i bordi della scatola come minimo e massimo. Di solito indicano invece Q1Q_1 e Q3Q_3.

Non pensare che una scatola più larga significhi "più dati" in quella zona. Significa che i valori lì coprono un intervallo più ampio sulla retta numerica.

Quando i diagrammi a scatola e baffi sono utili

I diagrammi a scatola e baffi sono utili quando vuoi una visione rapida del centro e della dispersione senza elencare ogni valore. Sono particolarmente utili per confrontare due o più gruppi affiancati.

Sono comuni nei corsi di statistica, nelle relazioni di laboratorio e in qualsiasi contesto in cui la mediana e la metà centrale dei dati contano più di un elenco dettagliato di tutti i valori.

Prova la tua versione

Prendi un piccolo insieme di dati già ordinati, trova la sintesi a cinque numeri e abbozza a mano il diagramma a scatola e baffi. Poi confrontalo con uno strumento grafico per verificare se la regola dei quartili e quella dei baffi corrispondono al risultato.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →