Un intervallo di confidenza al 95% significa che c'è il 95% di probabilità che il valore vero sia dentro questo intervallo?

Non nella consueta interpretazione frequentista. Significa che, se lo stesso processo di campionamento fosse ripetuto molte volte e ogni volta si costruisse un intervallo nello stesso modo, circa il 95% di quegli intervalli conterrebbe il vero parametro.

Qual è la formula di base dell'intervallo di confidenza?

La struttura generale è stima $\\pm$ valore critico $\\times$ errore standard. Il valore critico esatto e l'errore standard dipendono dal parametro e dalle ipotesi del metodo.

Intervallo di confidenza — Formula, calcolo ed esempi

Un intervallo di confidenza è un intervallo di valori plausibili per un parametro della popolazione, basato sui dati di un campione. In molti problemi introduttivi di statistica, si costruisce come

\text{estimate} \pm \text{margin of error}

Il margine di errore dipende da quanta incertezza c'è nel campione e da quanto vuoi essere sicuro. Un livello di confidenza più alto produce un intervallo più ampio. Dati più precisi producono un intervallo più stretto.

Cosa significa un intervallo di confidenza in parole semplici

Se vedi un intervallo di confidenza al $95\%$ , l'interpretazione più corretta riguarda il metodo, non un singolo intervallo già calcolato. Se lo stesso processo di campionamento fosse ripetuto molte volte e l'intervallo fosse ricostruito ogni volta nello stesso modo, circa il $95\%$ di quegli intervalli conterrebbe il vero parametro.

Quindi un intervallo di confidenza è un modo per mostrare l'incertezza attorno a una stima. Fornisce un intervallo plausibile, non una garanzia.

Formula dell'intervallo di confidenza

La struttura generale è

\text{estimate} \pm \text{critical value} \times \text{standard error}

Per la media di una popolazione, due versioni comuni sono:

\bar{x} \pm z^* \frac{\sigma}{\sqrt{n}}

Usa questa forma quando la deviazione standard della popolazione $\sigma$ è nota, oppure quando è giustificata un'approssimazione normale con un valore critico $z$ .

\bar{x} \pm t^* \frac{s}{\sqrt{n}}

Usa questa forma quando $\sigma$ è sconosciuta e stimi la dispersione con la deviazione standard campionaria $s$ . Per campioni più piccoli, questa formula di solito è accompagnata dalla condizione che la popolazione sia approssimativamente normale.

Lo stesso schema compare in molti contesti, ma l'errore standard cambia per medie, proporzioni e altri parametri.

Cosa cambia l'ampiezza di un intervallo di confidenza

Tre fattori contano più di tutti:

Un livello di confidenza più alto rende l'intervallo più ampio.
Una dimensione del campione più grande di solito rende l'intervallo più stretto.
Una maggiore variabilità nei dati rende l'intervallo più ampio.

Questo è il compromesso principale: più confidenza di solito costa precisione.

Esempio di intervallo di confidenza al 95%

Supponi che un campione di $64$ osservazioni abbia media $\bar{x} = 50$ , e che la deviazione standard della popolazione sia nota e pari a $\sigma = 8$ . Costruisci un intervallo di confidenza al $95\%$ per la media della popolazione usando un intervallo $z$ .

Parti da

\bar{x} \pm z^* \frac{\sigma}{\sqrt{n}}

Per un livello di confidenza del $95\%$ , usa $z^* \approx 1.96$ .

Ora calcola l'errore standard:

\frac{\sigma}{\sqrt{n}} = \frac{8}{\sqrt{64}} = \frac{8}{8} = 1

Quindi il margine di errore è

1.96 \times 1 = 1.96

Costruisci l'intervallo:

50 \pm 1.96

che dà

(48.04,\ 51.96)

Una lettura pratica è: se le condizioni del modello sono ragionevoli e i dati provengono da questo processo di campionamento, i valori compresi tra $48.04$ e $51.96$ sono plausibili per la media della popolazione.

Errori comuni con gli intervalli di confidenza

Un errore comune è dire che c'è una probabilità del $95\%$ che il vero parametro sia in questo specifico intervallo. Nella statistica frequentista standard, il parametro è fisso ed è la procedura di costruzione dell'intervallo ad avere quel tasso di successo nel lungo periodo.

Un altro errore è usare la formula sbagliata senza controllare le condizioni. Un intervallo $z$ , un intervallo $t$ e un intervallo per una proporzione non usano lo stesso errore standard.

Gli studenti confondono anche un intervallo di confidenza per un parametro con la dispersione dei dati grezzi. Un intervallo di confidenza riguarda l'incertezza di una stima, non dove cade la maggior parte delle singole osservazioni.

Quando si usano gli intervalli di confidenza

Gli intervalli di confidenza compaiono nei sondaggi, negli esperimenti, nel controllo qualità, in medicina, in economia e nella comunicazione quotidiana dei dati. Sono utili ogni volta che un campione viene usato per dire qualcosa su una popolazione più ampia.

In pratica, l'intervallo conta soprattutto quando lo confronti con un valore di riferimento o con un'altra stima. Un intervallo stretto supporta una conclusione più precisa rispetto a un intervallo ampio.

Prova un esercizio simile

Prova una tua versione con $\bar{x} = 72$ , $\sigma = 10$ e $n = 100$ per un intervallo di confidenza al $95\%$ . Poi cambia solo la dimensione del campione e osserva cosa succede al margine di errore. È uno dei modi più rapidi per sviluppare intuizione sul perché campioni più grandi producono di solito intervalli più stretti.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →