Test t — Tipi, formula e quando usarlo

Un test t ti aiuta a decidere se la media di un campione, oppure la differenza tra due medie campionarie, è più grande di quanto ci si aspetterebbe dalla sola variabilità casuale. Si usa quando la variabile di interesse è numerica e la deviazione standard della popolazione è sconosciuta, che è il caso più comune nella pratica.

La condizione chiave è che il test deve essere coerente con il disegno dei dati. Un test t serve per domande basate sulle medie, non per conteggi categoriali, e con campioni molto piccoli bisogna fare attenzione se ci sono forte asimmetria o outlier evidenti.

Che cosa misura un test t

L’idea di base è sempre la stessa:

t = \frac{\text{differenza osservata}}{\text{errore standard stimato}}

La statistica aumenta quando la differenza tra le medie è grande, e diminuisce quando i dati sono rumorosi o il campione è piccolo.

Sotto l’ipotesi nulla, e se le condizioni sono ragionevoli, questa statistica segue una distribuzione $t$ invece di una distribuzione normale $z$ . La distribuzione $t$ ha code più pesanti, soprattutto per campioni piccoli, quindi è più prudente nel dichiarare un risultato significativo.

Quale tipo di test t dovresti usare

Test t a un campione

Usalo quando hai un solo campione e vuoi confrontarne la media con un valore di riferimento $\mu_0$ .

t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

Esempio: confrontare il peso medio delle confezioni in un campione con un valore obiettivo di $100$ grammi.

Test t a due campioni

Usalo quando vuoi confrontare le medie di due gruppi indipendenti, come due classi istruite con metodi diversi.

Se non hai un motivo forte per assumere varianze uguali nelle popolazioni, il test t di Welch è di solito la scelta predefinita più sicura:

t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

I gradi di libertà per il test di Welch non sono semplicemente $n_1 + n_2 - 2$ , quindi di solito questa parte viene gestita dal software.

Test t per dati appaiati

Usalo per dati prima-e-dopo o per coppie abbinate. Il test non si esegue separatamente sulle due colonne grezze. Si esegue sulle differenze all’interno di ogni coppia.

t = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

In molti problemi con dati appaiati, il valore nullo è $\mu_{d,0} = 0$ , cioè la variazione media è zero.

Quando un test t è appropriato

Un test t è una buona scelta quando tutte queste condizioni sono ragionevolmente vere:

La variabile risposta è numerica.
Le osservazioni sono indipendenti all’interno del disegno scelto, a meno che tu non stia usando intenzionalmente una struttura appaiata.
La domanda riguarda una media o una differenza tra medie.
Il campione non è così piccolo e distorto da outlier o forte asimmetria da rendere fuorvianti la media e la deviazione standard.

Se la deviazione standard della popolazione fosse nota esattamente, l’alternativa diretta da manuale sarebbe un test $z$ . In pratica, i test t sono comuni perché $\sigma$ di solito è sconosciuta.

Esempio svolto: un test t a un campione

Supponiamo che un processo di confezionamento debba avere una media di $100$ grammi. Prendi un campione casuale di $25$ confezioni e trovi

\bar{x} = 102, \quad s = 4

Vuoi sapere se la vera media è diversa da $100$ grammi.

Poiché si tratta di un solo campione confrontato con un valore obiettivo, il test corretto è un test t a un campione.

Inizia con le ipotesi:

H_0: \mu = 100

H_1: \mu \ne 100

L’errore standard è

\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

Ora calcola la statistica del test:

t = \frac{102 - 100}{0.8} = 2.5

I gradi di libertà sono

df = n - 1 = 24

Per un test a due code con $df = 24$ , un valore di $t = 2.5$ dà un p-value inferiore a $0.05$ . Questo significa che il risultato è statisticamente significativo al livello del $5\%$ , quindi rifiuti $H_0$ .

Nel contesto, il campione fornisce evidenza che la media del processo è diversa da $100$ grammi. Questa conclusione dipende dal fatto che il campione sia ragionevolmente indipendente e non fortemente distorto da outlier.

Errori comuni con i test t

Un errore comune è scegliere la versione sbagliata del test. Se le stesse persone, macchine o unità vengono misurate due volte, i dati sono appaiati, quindi un test t a due campioni indipendenti non è appropriato.

Un altro errore è interpretare “non statisticamente significativo” come “non c’è differenza”. Di solito significa che il campione non ha fornito evidenza abbastanza forte contro l’ipotesi nulla.

Un terzo errore è saltare il controllo dei dati. Con un campione minuscolo e un outlier estremo, la formula produce comunque un numero, ma la conclusione potrebbe non essere affidabile.

Dove si usano i test t

I test t sono comuni negli esperimenti, nel controllo qualità, in medicina, in psicologia, nell’istruzione e nei confronti in stile A/B quando la variabile di interesse è numerica. Sono uno dei punti di ingresso standard nell’inferenza statistica perché collegano medie, variabilità, incertezza e processo decisionale in un unico metodo.

Prova un problema simile

Modifica l’esempio in modo che la media campionaria sia $101$ invece di $102$ , mantenendo $n = 25$ e $s = 4$ . Ricalcola la statistica t e decidi se l’evidenza è ancora abbastanza forte al livello del $5\%$ . È un passaggio utile se vuoi vedere come cambia la conclusione quando la media campionaria si avvicina al valore nullo.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →