Test di ipotesi

Il test di ipotesi è un modo per chiedersi se i dati di un campione siano troppo incoerenti con un’affermazione iniziale. Questa affermazione iniziale si chiama ipotesi nulla, indicata con $H_0$ .

Il metodo non dimostra che $H_0$ sia vera o falsa. Pone una domanda più specifica: se $H_0$ fosse vera, dati così estremi sarebbero abbastanza insoliti da farci dubitare?

L’idea di base

Ogni test di ipotesi ha due affermazioni in competizione:

L’ipotesi nulla $H_0$ , cioè l’affermazione di partenza che viene messa alla prova.
L’ipotesi alternativa $H_1$ o $H_a$ , cioè ciò che sosterresti se i dati fornissero prove sufficienti contro $H_0$ .

Poi si sceglie un livello di significatività $\alpha$ , spesso $0.05$ , prima di guardare il risultato. Questa è la soglia che stabilisce quanta evidenza serve per rifiutare $H_0$ .

Sono possibili due esiti:

Rifiutare $H_0$ : i dati sono sufficientemente incoerenti con il modello nullo.
Non rifiutare $H_0$ : i dati non sono abbastanza forti da escludere il modello nullo.

"Non rifiutare" non significa "accettare come vero". Significa solo che il campione non ha fornito prove abbastanza forti contro $H_0$ .

I passaggi usuali

Il procedimento di solito è questo:

Formulare chiaramente $H_0$ e $H_1$ .
Scegliere $\alpha$ e un test adatto ai dati e alle ipotesi del modello.
Calcolare una statistica test a partire dal campione.
Trasformare quella statistica in un $p$ -value oppure confrontarla con un valore critico.
Prendere la decisione e interpretarla nel contesto.

La statistica test dipende dalla situazione. Un test $z$ , un test $t$ , un test chi quadrato e molti altri sono tutti esempi di test di ipotesi. Non esiste un’unica formula valida per tutti i test di ipotesi.

Cosa significa il $p$ -value

Un $p$ -value è la probabilità, assumendo che $H_0$ sia vera e che le ipotesi del test siano soddisfatte, di ottenere un risultato almeno estremo quanto quello osservato.

Un $p$ -value piccolo significa che i dati sarebbero insoliti sotto $H_0$ . Per questo i $p$ -value piccoli vengono considerati evidenza contro l’ipotesi nulla.

Non significa:

La probabilità che $H_0$ sia falsa.
La probabilità che il tuo risultato sia avvenuto "per puro caso" in un senso vago e quotidiano.
La dimensione o l’importanza dell’effetto.

Principali tipi di test di ipotesi

Ci sono due modi utili per raggruppare i test.

Per direzione

Un test a una coda cerca un cambiamento in una sola direzione.

Coda destra: valori maggiori di quanto afferma l’ipotesi nulla supportano $H_1$ .
Coda sinistra: valori minori di quanto afferma l’ipotesi nulla supportano $H_1$ .

Un test a due code cerca una differenza in entrambe le direzioni. Se $H_1$ è "diverso da", la regione di rifiuto è divisa tra le due code.

Per tipo di dati

Un test $z$ si usa in alcuni casi di verifica sulla media quando la deviazione standard della popolazione è nota oppure quando si usa un’approssimazione giustificata con campioni grandi.
Un test $t$ è comune per le medie quando la deviazione standard della popolazione è ignota e le condizioni sono ragionevoli.
Un test chi quadrato si usa per dati categoriali espressi come conteggi.

Il test giusto dipende dal tipo di variabile, dal disegno campionario e dalle ipotesi del modello. Scegliere prima la formula e poi la domanda è un errore comune.

Esempio svolto

Supponiamo che una macchina riempitrice debba avere una media di $500$ mL per bottiglia. Un team di controllo qualità prende un campione di $36$ bottiglie e ottiene una media campionaria di $496$ mL.

Supponiamo, per questo esempio, che la deviazione standard della popolazione sia nota e pari a $\sigma = 12$ mL e che le condizioni di campionamento giustifichino un test $z$ a un campione.

Impostiamo le ipotesi:

H_0: \mu = 500

H_1: \mu < 500

Questo è un test a coda sinistra perché la preoccupazione è un riempimento insufficiente.

L’errore standard è

\frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{36}} = 2

Quindi la statistica test è

z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{496 - 500}{2} = -2

Se $\alpha = 0.05$ per un test $z$ a coda sinistra, il valore critico è circa $-1.645$ . Poiché $-2 < -1.645$ , il risultato cade nella regione di rifiuto.

Quindi la decisione è rifiutare $H_0$ al livello del $5\%$ . Nel contesto, il campione fornisce evidenza che la macchina, in media, riempie meno del dovuto.

Questa conclusione dipende dalle ipotesi del test. Se le ipotesi non sono adeguate, la conclusione può essere poco affidabile anche se i calcoli sono corretti.

Errori di tipo I e di tipo II

Il test di ipotesi comporta sempre un rischio di errore.

Un errore di tipo I significa rifiutare $H_0$ anche se è vera. La sua probabilità è controllata da $\alpha$ .

Un errore di tipo II significa non rifiutare $H_0$ anche se $H_1$ è vera. La sua probabilità si indica di solito con $\beta$ .

Ridurre $\alpha$ rende meno probabili i falsi allarmi, ma può anche rendere più difficile rilevare effetti reali se nient’altro cambia. Questo compromesso è uno dei motivi per cui la dimensione del campione conta.

Errori comuni

Un errore comune è dire che un risultato non significativo dimostra che non esiste alcun effetto. Di solito mostra solo che i dati non erano abbastanza forti per rilevarne uno.

Un altro errore è trattare la significatività statistica come se fosse importanza pratica. Un effetto minuscolo può essere statisticamente significativo in un campione molto grande.

Si usano male i test anche quando si ignorano ipotesi su indipendenza, forma della distribuzione, varianza o tipo di dati. Un $p$ -value dall’aspetto pulito non salva un test scelto male.

Quando si usa il test di ipotesi

Il test di ipotesi si usa nella scienza, nella produzione industriale, in medicina, nei sondaggi, nei test A/B e nell’analisi delle politiche pubbliche. L’obiettivo di solito è lo stesso: decidere se il campione fornisce prove sufficienti per mettere in dubbio un’affermazione di partenza.

In pratica, un buon test non riguarda solo il calcolo. Richiede anche un’ipotesi nulla sensata, un disegno difendibile e un’interpretazione coerente con ciò che il test può davvero dire.

Prova una tua versione

Prendi lo stesso esempio del riempimento delle bottiglie, ma cambia la media campionaria in $498$ mL. Ricalcola la statistica test e verifica se la decisione cambia con $\alpha = 0.05$ . È un modo rapido per vedere come l’evidenza diventa più forte o più debole quando il risultato del campione si avvicina al valore nullo.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →