Una distribuzione normale è un modello di probabilità a forma di campana in cui i valori vicini alla media sono i più comuni e i valori più lontani diventano meno frequenti in modo simmetrico. Se stai cercando di capire la curva a campana, lo z-score o la formula della distribuzione normale, l’idea chiave è semplice: la media fissa il centro e la deviazione standard determina la dispersione.

Questo modello è utile solo quando la forma normale è un adattamento ragionevole ai dati o alla situazione. Quando questa condizione è soddisfatta, puoi stimare intervalli tipici, confrontare valori con gli z-score e interpretare quanto un risultato sia insolito.

Che cosa significa la curva a campana

Se una variabile segue una distribuzione normale, i valori vicini alla media sono più comuni di quelli lontani. Il lato sinistro e quello destro sono speculari, quindi trovarsi a 22 deviazioni standard sopra la media è insolito quanto trovarsi a 22 deviazioni standard sotto la media.

Spesso vedrai la notazione

XN(μ,σ2)X \sim N(\mu, \sigma^2)

Questo significa che la variabile casuale XX è modellata come normale con media μ\mu e varianza σ2\sigma^2. Poiché la varianza è σ2\sigma^2, la deviazione standard è σ\sigma, con σ>0\sigma > 0.

Formula della distribuzione normale, in parole semplici

La formula della densità normale è

f(x)=1σ2πe(xμ)2/(2σ2)f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-(x-\mu)^2/(2\sigma^2)}

Non serve memorizzare ogni parte della formula per usare bene l’idea. La cosa più importante è che μ\mu sposta la curva a sinistra o a destra, mentre σ\sigma la rende più stretta o più larga.

Questa formula descrive una densità, non la probabilità di un singolo valore esatto. Per un modello continuo, le probabilità derivano da intervalli come P(X<80)P(X < 80) o P(65X85)P(65 \le X \le 85).

Come si collegano media, deviazione standard e z-score

Cambiare la media sposta la curva a sinistra o a destra. Cambiare la deviazione standard rende la curva più stretta o più larga. Un valore piccolo di σ\sigma significa che i dati sono concentrati attorno alla media. Un valore più grande di σ\sigma significa che sono più dispersi.

Per confrontare un valore con il resto della distribuzione, usa lo z-score:

z=xμσz = \frac{x - \mu}{\sigma}

Questo indica la posizione relativa in unità di deviazione standard. Se z=1.5z = 1.5, il valore si trova 1.51.5 deviazioni standard sopra la media. Se z=2z = -2, si trova 22 deviazioni standard sotto la media.

Per un modello normale, una scorciatoia pratica è la regola empirica:

circa il 68% dei valori si trova entro μ±σ\text{circa il } 68\% \text{ dei valori si trova entro } \mu \pm \sigma circa il 95% dei valori si trova entro μ±2σ\text{circa il } 95\% \text{ dei valori si trova entro } \mu \pm 2\sigma circa il 99.7% dei valori si trova entro μ±3σ\text{circa il } 99.7\% \text{ dei valori si trova entro } \mu \pm 3\sigma

Usa questa regola solo quando un modello normale è davvero ragionevole. È un’approssimazione utile, non una garanzia per ogni insieme di dati reali.

Esempio svolto con z-score e curva a campana

Supponiamo che i punteggi di un esame siano modellati da

XN(70,102)X \sim N(70, 10^2)

Quindi il punteggio medio è 7070 e la deviazione standard è 1010.

Per prima cosa, usa la regola empirica. Circa il 68%68\% dei punteggi dovrebbe trovarsi entro una deviazione standard dalla media:

70±1070 \pm 10

Quindi l’intervallo rapido è

60 a 8060 \text{ a } 80

Circa il 95%95\% dei punteggi dovrebbe trovarsi entro due deviazioni standard:

70±2(10)=70±2070 \pm 2(10) = 70 \pm 20

Quindi quell’intervallo è

50 a 9050 \text{ a } 90

Ora considera uno studente che ha ottenuto 8585. Lo z-score è

z=857010=1.5z = \frac{85 - 70}{10} = 1.5

Questo significa che il punteggio è 1.51.5 deviazioni standard sopra la media. Questa è l’interpretazione più rapida e utile: il punteggio è chiaramente sopra la media, ma non estremamente lontano nella coda della distribuzione.

Errori comuni nei problemi sulla distribuzione normale

Considerare normale ogni grafico a campana

Alcuni dati sono asimmetrici, hanno code pesanti o presentano più picchi. In questi casi, un modello normale può adattarsi male anche se il grafico appare grossolanamente arrotondato.

Confondere densità e probabilità

La formula f(x)f(x) non è la probabilità che XX sia uguale a un numero esatto. Per le distribuzioni continue, la probabilità in un punto esatto è 00, quindi si lavora invece con intervalli.

Usare la regola empirica senza verificare il modello

La regola 6868-9595-99.799.7 appartiene alla distribuzione normale. Non dovrebbe essere applicata automaticamente a qualsiasi insieme di dati.

Confondere varianza e deviazione standard

La varianza è σ2\sigma^2. Lo z-score usa σ\sigma, non σ2\sigma^2.

Quando si usa la distribuzione normale

La distribuzione normale compare spesso quando le misurazioni si concentrano attorno a un valore centrale e i valori estremi sono relativamente rari. È comune nei modelli di errore di misura, nell’interpretazione dei punteggi dei test, nel controllo qualità e nello studio delle medie campionarie.

Questo non significa che tutti i dati reali siano normali. Significa che il modello normale è un’approssimazione utile quando la forma, il contesto e le ipotesi rendono ragionevole tale approssimazione.

Prova un esercizio simile

Modifica l’esempio in XN(100,152)X \sim N(100, 15^2) e calcola lo z-score di 130130. Poi trova l’intervallo che copre circa il 95%95\% dei valori. Provare una tua versione con una media o una deviazione standard diversa è un buon modo per vedere come cambia la curva a campana.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →