Un diagramma a scatola e baffi mostra a colpo d’occhio il centro, la dispersione e la possibile asimmetria di un insieme di dati. Si costruisce a partire dal riassunto a cinque numeri: minimo, primo quartile , mediana, terzo quartile e massimo. Se nella tua classe o nel tuo software si usa la regola di , i baffi possono fermarsi ai valori non anomali più estremi invece che al minimo e al massimo assoluti.
La scatola va da a , quindi contiene il centrale dei dati. La linea all’interno della scatola è la mediana. I baffi mostrano fin dove si estendono i dati oltre quella metà centrale.
Cosa mostra un diagramma a scatola e baffi
Un box plot ti aiuta a rispondere rapidamente a tre domande:
- Dov’è il centro? Guarda la mediana.
- Quanto è dispersa la metà centrale? Guarda la larghezza della scatola.
- Le code sono bilanciate? Confronta i due baffi.
La larghezza della scatola è l’intervallo interquartile, cioè . Un più grande significa che la metà centrale dei dati è più dispersa. Se un baffo è molto più lungo dell’altro, i dati possono essere asimmetrici in quella direzione.
Molti box plot usano anche la regola di per indicare possibili valori anomali. In quella versione, i baffi si fermano ai valori non anomali più estremi. Per questo motivo, due box plot corretti dello stesso insieme di dati possono apparire leggermente diversi se usano regole diverse per i baffi.
Esempio svolto: dai dati al box plot
Usa l’insieme di dati ordinato
Ci sono valori, quindi la mediana è la media dei due valori centrali:
Poiché c’è un numero pari di dati, dividi l’elenco in due metà uguali. La metà inferiore è , quindi
La metà superiore è , quindi
Questo dà il riassunto a cinque numeri:
Ora calcola l’intervallo interquartile:
Se usi la comune regola dei valori anomali di , i limiti sono
e
Tutti i valori dei dati sono compresi tra e , quindi non ci sono possibili valori anomali secondo questa regola. Per questo insieme di dati, la scatola andrebbe da a , la linea della mediana sarebbe a e i baffi arriverebbero a e .
Come leggere rapidamente un box plot
Inizia dalla linea della mediana. Ti dice dove si trova il centro dei dati.
Poi confronta la larghezza della scatola e la lunghezza dei baffi. La scatola mostra dove si trova il centrale dei valori, mentre i baffi mostrano quanto si estendono le code oltre quella regione.
Infine, cerca eventuali asimmetrie. Se la mediana non è al centro della scatola, oppure un baffo è molto più lungo dell’altro, la distribuzione potrebbe non essere bilanciata attorno al centro.
Errori comuni con i diagrammi a scatola e baffi
Un errore comune è leggere i bordi della scatola come minimo e massimo. Di solito rappresentano e , non gli estremi dell’intero insieme di dati.
Un altro errore è supporre che ogni box plot usi la stessa regola per i baffi. Alcuni baffi si estendono fino al minimo e al massimo. Altri si fermano ai valori non anomali più estremi.
È anche facile dimenticare che i quartili dipendono dai dati ordinati. Se i valori non vengono prima messi in ordine, i quartili e la mediana saranno sbagliati.
Quando i box plot sono utili
I diagrammi a scatola e baffi sono utili quando vuoi un riassunto rapido di una distribuzione invece di un elenco completo di valori. Sono comuni nei corsi di statistica, nei riepiloghi di esperimenti, nel controllo qualità e nei confronti tra gruppi.
Sono particolarmente utili quando contano i valori anomali o l’asimmetria, perché la mediana e i quartili sono di solito più stabili della sola media.
Prova con un insieme di dati simile
Prendi un piccolo insieme di dati già ordinato, scrivi il suo riassunto a cinque numeri e disegna la scatola prima di preoccuparti dei valori anomali. Se vuoi controllare quartili e mediana in un problema di statistica simile, prova la tua versione in un solver dopo aver impostato da solo l’elenco ordinato.
Hai bisogno di aiuto con un problema?
Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.
Apri GPAI Solver →