La varianza misura quanto i numeri sono dispersi attorno alla loro media. Una varianza piccola significa che i valori restano abbastanza vicini alla media. Una varianza grande significa che sono più sparsi.
Per calcolare la varianza, si determina quanto ogni valore dista dalla media, si elevano al quadrato queste distanze e se ne fa la media. Il quadrato è importante perché altrimenti gli scarti positivi e negativi si annullerebbero.
Formula della varianza: popolazione vs campione
Usa la formula della varianza della popolazione quando i tuoi dati includono tutti i valori del gruppo che vuoi descrivere:
Usa la formula della varianza campionaria quando i tuoi dati sono solo un campione e vuoi stimare la dispersione di una popolazione più ampia:
L’unica differenza è il denominatore. Usa per un’intera popolazione. Usa per una stima basata su un campione.
Cosa significa la varianza
La varianza non ti dice dove si trova il centro. Ti dice quanto i dati tendono a trovarsi lontano da quel centro.
Se due insiemi di dati hanno la stessa media, quello con la varianza più grande ha valori che, in media, si trovano più lontano dalla media. Poiché gli scarti vengono elevati al quadrato, le differenze insolitamente grandi hanno un peso maggiore.
Un dettaglio importante: la varianza si misura in unità quadrate. Se i dati sono in metri, la varianza è in metri quadrati. Per questo motivo la deviazione standard è spesso più facile da interpretare nell’uso quotidiano.
Come calcolare la varianza: esempio svolto
Usa l’insieme di dati .
Per prima cosa trova la media:
Ora sottrai la media da ogni valore ed eleva al quadrato il risultato:
Somma questi scarti quadratici:
Se questi otto valori rappresentano l’intera popolazione, la varianza della popolazione è:
Se gli stessi otto valori vengono considerati come un campione di una popolazione più ampia, la varianza campionaria è:
Questo esempio mostra chiaramente l’idea principale: gli scarti quadratici sono gli stessi, ma il risultato finale cambia a seconda che tu divida per oppure per .
Errori comuni sulla varianza
- Dimenticare di elevare al quadrato gli scarti. Se fai la media degli scarti semplici, i valori positivi e negativi si annullano e non misuri più correttamente la dispersione.
- Confondere la varianza della popolazione con quella campionaria. Dividi per per un’intera popolazione e per per un campione usato per stimare una popolazione più grande.
- Dimenticare che la varianza usa unità quadrate. La varianza è utile, ma la deviazione standard è spesso più facile da leggere perché torna alle unità originali.
- Supporre che una varianza grande sia sempre negativa. Una varianza maggiore significa solo maggiore dispersione. Se questo sia importante dipende dal contesto.
Quando si usa la varianza
La varianza si usa ogni volta che devi descrivere o confrontare la dispersione in modo coerente.
- In statistica, aiuta a riassumere quanto un insieme di dati sia disperso.
- Nel controllo qualità, può aiutare a monitorare se un processo resta costante nel tempo.
- In finanza, la varianza si usa per descrivere quanto oscillano i rendimenti, anche se è solo uno dei modi per ragionare sul rischio.
- Nel machine learning e nell’analisi dei dati, aiuta a descrivere come le caratteristiche o gli errori variano tra le osservazioni.
Prova un esercizio simile
Prova una tua versione con due piccoli insiemi di dati che abbiano la stessa media ma una dispersione diversa. Calcola la varianza di entrambi e verifica se l’insieme di dati più disperso ottiene il valore più grande. Questo semplice confronto di solito aiuta a fissare bene il concetto.
Hai bisogno di aiuto con un problema?
Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.
Apri GPAI Solver →