Le misure di dispersione indicano quanto è disperso un insieme di dati. Le tre misure di base sono intervallo di variazione, varianza e deviazione standard. L’intervallo di variazione usa solo il valore più basso e quello più alto, la varianza misura la distanza quadratica media dalla media, e la deviazione standard è la radice quadrata della varianza, quindi riporta la dispersione nelle unità originali.

Se vuoi una sintesi rapida, usa l’intervallo di variazione per un controllo veloce, la varianza per il lavoro statistico formale e la deviazione standard quando vuoi una misura della dispersione più facile da interpretare.

Intervallo di variazione, varianza e deviazione standard in sintesi

L’intervallo di variazione è la distanza tra il minimo e il massimo:

range=maximumminimum\text{range} = \text{maximum} - \text{minimum}

Si calcola rapidamente, ma usa solo due valori. Un singolo valore estremo può modificarlo molto.

La varianza misura quanto i valori tendono a stare lontani dalla media dopo che queste distanze sono state elevate al quadrato.

Per un’intera popolazione,

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

Per un campione usato per stimare una popolazione più ampia,

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

Usa NN solo quando i tuoi dati rappresentano l’intera popolazione che ti interessa. Usa n1n-1 quando i tuoi dati sono un campione estratto da un gruppo più grande.

La deviazione standard è la radice quadrata della varianza:

σ=σ2\sigma = \sqrt{\sigma^2}

oppure, per un campione,

s=s2s = \sqrt{s^2}

Poiché è espressa nelle unità originali, la deviazione standard di solito è più facile da leggere della varianza.

Esempio svolto: stesso intervallo, dispersione diversa

Confronta questi due insiemi di dati:

  • Insieme A: 2,5,5,5,82, 5, 5, 5, 8
  • Insieme B: 2,2,5,8,82, 2, 5, 8, 8

Entrambi hanno lo stesso minimo, lo stesso massimo e la stessa media.

Per ciascun insieme,

range=82=6\text{range} = 8 - 2 = 6

e

mean=255=5\text{mean} = \frac{25}{5} = 5

Quindi il solo intervallo di variazione dice che hanno la stessa ampiezza. Ma i valori sono distribuiti in modo diverso attorno alla media.

Insieme A

Gli scarti dalla media sono

3, 0, 0, 0, 3-3,\ 0,\ 0,\ 0,\ 3

Elevandoli al quadrato si ottiene

9, 0, 0, 0, 99,\ 0,\ 0,\ 0,\ 9

La somma degli scarti quadratici è 1818. Se trattiamo i dati come una popolazione,

σ2=185=3.6\sigma^2 = \frac{18}{5} = 3.6

e

σ=3.61.90\sigma = \sqrt{3.6} \approx 1.90

Insieme B

Gli scarti dalla media sono

3, 3, 0, 3, 3-3,\ -3,\ 0,\ 3,\ 3

Elevandoli al quadrato si ottiene

9, 9, 0, 9, 99,\ 9,\ 0,\ 9,\ 9

La somma degli scarti quadratici è 3636, quindi

σ2=365=7.2\sigma^2 = \frac{36}{5} = 7.2

e

σ=7.22.68\sigma = \sqrt{7.2} \approx 2.68

Entrambi gli insiemi hanno lo stesso intervallo di variazione, ma l’Insieme B ha varianza e deviazione standard maggiori. Questa è l’idea chiave: l’intervallo di variazione considera solo gli estremi, mentre varianza e deviazione standard usano l’intero insieme di dati.

Errori comuni con le misure di dispersione

Un errore comune è supporre che lo stesso intervallo di variazione significhi la stessa dispersione. L’esempio sopra mostra perché è falso.

Un altro errore è trattare la varianza come se fosse espressa nelle unità originali. Non lo è. Se i dati sono in metri, la varianza è in metri quadrati.

Un terzo errore è confondere le formule per popolazione e campione. Il denominatore corretto dipende dalla situazione: usa NN per un’intera popolazione e n1n-1 per un campione.

È utile ricordare anche che varianza e deviazione standard sono sensibili ai valori anomali, perché i grandi scarti vengono elevati al quadrato prima di fare la media.

Quando è utile ciascuna misura

Usa l’intervallo di variazione quando vuoi una prima occhiata rapida a quanto si estendono i dati.

Usa la varianza quando ti serve la misura della dispersione all’interno di altri metodi statistici. Molte formule di probabilità e statistica si basano sulla varianza, anche quando nei risultati finali si riporta invece la deviazione standard.

Usa la deviazione standard quando vuoi una descrizione pratica della dispersione nelle stesse unità dei dati. In molte sintesi scolastiche e del mondo reale, è la scelta più leggibile.

Prova un esercizio simile

Crea due piccoli insiemi di dati con la stessa media e lo stesso intervallo di variazione, poi confronta la loro varianza e deviazione standard. Se vuoi fare un passo in più, prova la tua versione in un risolutore dopo averla svolta a mano.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →