Il test di ipotesi è un modo per chiedersi se i dati di un campione siano troppo incoerenti con un’affermazione iniziale. Questa affermazione iniziale si chiama ipotesi nulla, indicata con H0H_0.

Il metodo non dimostra che H0H_0 sia vera o falsa. Pone una domanda più specifica: se H0H_0 fosse vera, dati così estremi sarebbero abbastanza insoliti da farci dubitare?

L’idea di base

Ogni test di ipotesi ha due affermazioni in competizione:

  1. L’ipotesi nulla H0H_0, cioè l’affermazione di partenza che viene messa alla prova.
  2. L’ipotesi alternativa H1H_1 o HaH_a, cioè ciò che sosterresti se i dati fornissero prove sufficienti contro H0H_0.

Poi si sceglie un livello di significatività α\alpha, spesso 0.050.05, prima di guardare il risultato. Questa è la soglia che stabilisce quanta evidenza serve per rifiutare H0H_0.

Sono possibili due esiti:

  1. Rifiutare H0H_0: i dati sono sufficientemente incoerenti con il modello nullo.
  2. Non rifiutare H0H_0: i dati non sono abbastanza forti da escludere il modello nullo.

"Non rifiutare" non significa "accettare come vero". Significa solo che il campione non ha fornito prove abbastanza forti contro H0H_0.

I passaggi usuali

Il procedimento di solito è questo:

  1. Formulare chiaramente H0H_0 e H1H_1.
  2. Scegliere α\alpha e un test adatto ai dati e alle ipotesi del modello.
  3. Calcolare una statistica test a partire dal campione.
  4. Trasformare quella statistica in un pp-value oppure confrontarla con un valore critico.
  5. Prendere la decisione e interpretarla nel contesto.

La statistica test dipende dalla situazione. Un test zz, un test tt, un test chi quadrato e molti altri sono tutti esempi di test di ipotesi. Non esiste un’unica formula valida per tutti i test di ipotesi.

Cosa significa il pp-value

Un pp-value è la probabilità, assumendo che H0H_0 sia vera e che le ipotesi del test siano soddisfatte, di ottenere un risultato almeno estremo quanto quello osservato.

Un pp-value piccolo significa che i dati sarebbero insoliti sotto H0H_0. Per questo i pp-value piccoli vengono considerati evidenza contro l’ipotesi nulla.

Non significa:

  1. La probabilità che H0H_0 sia falsa.
  2. La probabilità che il tuo risultato sia avvenuto "per puro caso" in un senso vago e quotidiano.
  3. La dimensione o l’importanza dell’effetto.

Principali tipi di test di ipotesi

Ci sono due modi utili per raggruppare i test.

Per direzione

Un test a una coda cerca un cambiamento in una sola direzione.

  • Coda destra: valori maggiori di quanto afferma l’ipotesi nulla supportano H1H_1.
  • Coda sinistra: valori minori di quanto afferma l’ipotesi nulla supportano H1H_1.

Un test a due code cerca una differenza in entrambe le direzioni. Se H1H_1 è "diverso da", la regione di rifiuto è divisa tra le due code.

Per tipo di dati

  • Un test zz si usa in alcuni casi di verifica sulla media quando la deviazione standard della popolazione è nota oppure quando si usa un’approssimazione giustificata con campioni grandi.
  • Un test tt è comune per le medie quando la deviazione standard della popolazione è ignota e le condizioni sono ragionevoli.
  • Un test chi quadrato si usa per dati categoriali espressi come conteggi.

Il test giusto dipende dal tipo di variabile, dal disegno campionario e dalle ipotesi del modello. Scegliere prima la formula e poi la domanda è un errore comune.

Esempio svolto

Supponiamo che una macchina riempitrice debba avere una media di 500500 mL per bottiglia. Un team di controllo qualità prende un campione di 3636 bottiglie e ottiene una media campionaria di 496496 mL.

Supponiamo, per questo esempio, che la deviazione standard della popolazione sia nota e pari a σ=12\sigma = 12 mL e che le condizioni di campionamento giustifichino un test zz a un campione.

Impostiamo le ipotesi:

H0:μ=500H_0: \mu = 500 H1:μ<500H_1: \mu < 500

Questo è un test a coda sinistra perché la preoccupazione è un riempimento insufficiente.

L’errore standard è

σn=1236=2\frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{36}} = 2

Quindi la statistica test è

z=xˉμ0σ/n=4965002=2z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{496 - 500}{2} = -2

Se α=0.05\alpha = 0.05 per un test zz a coda sinistra, il valore critico è circa 1.645-1.645. Poiché 2<1.645-2 < -1.645, il risultato cade nella regione di rifiuto.

Quindi la decisione è rifiutare H0H_0 al livello del 5%5\%. Nel contesto, il campione fornisce evidenza che la macchina, in media, riempie meno del dovuto.

Questa conclusione dipende dalle ipotesi del test. Se le ipotesi non sono adeguate, la conclusione può essere poco affidabile anche se i calcoli sono corretti.

Errori di tipo I e di tipo II

Il test di ipotesi comporta sempre un rischio di errore.

Un errore di tipo I significa rifiutare H0H_0 anche se è vera. La sua probabilità è controllata da α\alpha.

Un errore di tipo II significa non rifiutare H0H_0 anche se H1H_1 è vera. La sua probabilità si indica di solito con β\beta.

Ridurre α\alpha rende meno probabili i falsi allarmi, ma può anche rendere più difficile rilevare effetti reali se nient’altro cambia. Questo compromesso è uno dei motivi per cui la dimensione del campione conta.

Errori comuni

Un errore comune è dire che un risultato non significativo dimostra che non esiste alcun effetto. Di solito mostra solo che i dati non erano abbastanza forti per rilevarne uno.

Un altro errore è trattare la significatività statistica come se fosse importanza pratica. Un effetto minuscolo può essere statisticamente significativo in un campione molto grande.

Si usano male i test anche quando si ignorano ipotesi su indipendenza, forma della distribuzione, varianza o tipo di dati. Un pp-value dall’aspetto pulito non salva un test scelto male.

Quando si usa il test di ipotesi

Il test di ipotesi si usa nella scienza, nella produzione industriale, in medicina, nei sondaggi, nei test A/B e nell’analisi delle politiche pubbliche. L’obiettivo di solito è lo stesso: decidere se il campione fornisce prove sufficienti per mettere in dubbio un’affermazione di partenza.

In pratica, un buon test non riguarda solo il calcolo. Richiede anche un’ipotesi nulla sensata, un disegno difendibile e un’interpretazione coerente con ciò che il test può davvero dire.

Prova una tua versione

Prendi lo stesso esempio del riempimento delle bottiglie, ma cambia la media campionaria in 498498 mL. Ricalcola la statistica test e verifica se la decisione cambia con α=0.05\alpha = 0.05. È un modo rapido per vedere come l’evidenza diventa più forte o più debole quando il risultato del campione si avvicina al valore nullo.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →