Che cos’è una distribuzione normale in parole semplici?

Una distribuzione normale è un modello di probabilità continuo e simmetrico in cui i valori vicini alla media sono i più comuni, mentre quelli più lontani diventano meno frequenti secondo un andamento a campana.

Che cosa indica uno z-score?

Uno z-score indica di quante deviazioni standard un valore si trova sopra o sotto la media. Descrive la posizione relativa, non una probabilità esatta da solo.

Distribuzione normale — Curva a campana, z-score e formula

Una distribuzione normale è un modello di probabilità a forma di campana in cui i valori vicini alla media sono i più comuni e i valori più lontani diventano meno frequenti in modo simmetrico. Se stai cercando di capire la curva a campana, lo z-score o la formula della distribuzione normale, l’idea chiave è semplice: la media fissa il centro e la deviazione standard determina la dispersione.

Questo modello è utile solo quando la forma normale è un adattamento ragionevole ai dati o alla situazione. Quando questa condizione è soddisfatta, puoi stimare intervalli tipici, confrontare valori con gli z-score e interpretare quanto un risultato sia insolito.

Che cosa significa la curva a campana

Se una variabile segue una distribuzione normale, i valori vicini alla media sono più comuni di quelli lontani. Il lato sinistro e quello destro sono speculari, quindi trovarsi a $2$ deviazioni standard sopra la media è insolito quanto trovarsi a $2$ deviazioni standard sotto la media.

Spesso vedrai la notazione

X \sim N(\mu, \sigma^2)

Questo significa che la variabile casuale $X$ è modellata come normale con media $\mu$ e varianza $\sigma^2$ . Poiché la varianza è $\sigma^2$ , la deviazione standard è $\sigma$ , con $\sigma > 0$ .

Formula della distribuzione normale, in parole semplici

La formula della densità normale è

f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-(x-\mu)^2/(2\sigma^2)}

Non serve memorizzare ogni parte della formula per usare bene l’idea. La cosa più importante è che $\mu$ sposta la curva a sinistra o a destra, mentre $\sigma$ la rende più stretta o più larga.

Questa formula descrive una densità, non la probabilità di un singolo valore esatto. Per un modello continuo, le probabilità derivano da intervalli come $P(X < 80)$ o $P(65 \le X \le 85)$ .

Come si collegano media, deviazione standard e z-score

Cambiare la media sposta la curva a sinistra o a destra. Cambiare la deviazione standard rende la curva più stretta o più larga. Un valore piccolo di $\sigma$ significa che i dati sono concentrati attorno alla media. Un valore più grande di $\sigma$ significa che sono più dispersi.

Per confrontare un valore con il resto della distribuzione, usa lo z-score:

z = \frac{x - \mu}{\sigma}

Questo indica la posizione relativa in unità di deviazione standard. Se $z = 1.5$ , il valore si trova $1.5$ deviazioni standard sopra la media. Se $z = -2$ , si trova $2$ deviazioni standard sotto la media.

Per un modello normale, una scorciatoia pratica è la regola empirica:

\text{circa il } 68\% \text{ dei valori si trova entro } \mu \pm \sigma

\text{circa il } 95\% \text{ dei valori si trova entro } \mu \pm 2\sigma

\text{circa il } 99.7\% \text{ dei valori si trova entro } \mu \pm 3\sigma

Usa questa regola solo quando un modello normale è davvero ragionevole. È un’approssimazione utile, non una garanzia per ogni insieme di dati reali.

Esempio svolto con z-score e curva a campana

Supponiamo che i punteggi di un esame siano modellati da

X \sim N(70, 10^2)

Quindi il punteggio medio è $70$ e la deviazione standard è $10$ .

Per prima cosa, usa la regola empirica. Circa il $68\%$ dei punteggi dovrebbe trovarsi entro una deviazione standard dalla media:

70 \pm 10

Quindi l’intervallo rapido è

60 \text{ a } 80

Circa il $95\%$ dei punteggi dovrebbe trovarsi entro due deviazioni standard:

70 \pm 2(10) = 70 \pm 20

Quindi quell’intervallo è

50 \text{ a } 90

Ora considera uno studente che ha ottenuto $85$ . Lo z-score è

z = \frac{85 - 70}{10} = 1.5

Questo significa che il punteggio è $1.5$ deviazioni standard sopra la media. Questa è l’interpretazione più rapida e utile: il punteggio è chiaramente sopra la media, ma non estremamente lontano nella coda della distribuzione.

Errori comuni nei problemi sulla distribuzione normale

Considerare normale ogni grafico a campana

Alcuni dati sono asimmetrici, hanno code pesanti o presentano più picchi. In questi casi, un modello normale può adattarsi male anche se il grafico appare grossolanamente arrotondato.

Confondere densità e probabilità

La formula $f(x)$ non è la probabilità che $X$ sia uguale a un numero esatto. Per le distribuzioni continue, la probabilità in un punto esatto è $0$ , quindi si lavora invece con intervalli.

Usare la regola empirica senza verificare il modello

La regola $68$ - $95$ - $99.7$ appartiene alla distribuzione normale. Non dovrebbe essere applicata automaticamente a qualsiasi insieme di dati.

Confondere varianza e deviazione standard

La varianza è $\sigma^2$ . Lo z-score usa $\sigma$ , non $\sigma^2$ .

Quando si usa la distribuzione normale

La distribuzione normale compare spesso quando le misurazioni si concentrano attorno a un valore centrale e i valori estremi sono relativamente rari. È comune nei modelli di errore di misura, nell’interpretazione dei punteggi dei test, nel controllo qualità e nello studio delle medie campionarie.

Questo non significa che tutti i dati reali siano normali. Significa che il modello normale è un’approssimazione utile quando la forma, il contesto e le ipotesi rendono ragionevole tale approssimazione.

Prova un esercizio simile

Modifica l’esempio in $X \sim N(100, 15^2)$ e calcola lo z-score di $130$ . Poi trova l’intervallo che copre circa il $95\%$ dei valori. Provare una tua versione con una media o una deviazione standard diversa è un buon modo per vedere come cambia la curva a campana.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →