Un test t ti aiuta a decidere se la media di un campione, oppure la differenza tra due medie campionarie, è più grande di quanto ci si aspetterebbe dalla sola variabilità casuale. Si usa quando la variabile di interesse è numerica e la deviazione standard della popolazione è sconosciuta, che è il caso più comune nella pratica.
La condizione chiave è che il test deve essere coerente con il disegno dei dati. Un test t serve per domande basate sulle medie, non per conteggi categoriali, e con campioni molto piccoli bisogna fare attenzione se ci sono forte asimmetria o outlier evidenti.
Che cosa misura un test t
L’idea di base è sempre la stessa:
La statistica aumenta quando la differenza tra le medie è grande, e diminuisce quando i dati sono rumorosi o il campione è piccolo.
Sotto l’ipotesi nulla, e se le condizioni sono ragionevoli, questa statistica segue una distribuzione invece di una distribuzione normale . La distribuzione ha code più pesanti, soprattutto per campioni piccoli, quindi è più prudente nel dichiarare un risultato significativo.
Quale tipo di test t dovresti usare
Test t a un campione
Usalo quando hai un solo campione e vuoi confrontarne la media con un valore di riferimento .
Esempio: confrontare il peso medio delle confezioni in un campione con un valore obiettivo di grammi.
Test t a due campioni
Usalo quando vuoi confrontare le medie di due gruppi indipendenti, come due classi istruite con metodi diversi.
Se non hai un motivo forte per assumere varianze uguali nelle popolazioni, il test t di Welch è di solito la scelta predefinita più sicura:
I gradi di libertà per il test di Welch non sono semplicemente , quindi di solito questa parte viene gestita dal software.
Test t per dati appaiati
Usalo per dati prima-e-dopo o per coppie abbinate. Il test non si esegue separatamente sulle due colonne grezze. Si esegue sulle differenze all’interno di ogni coppia.
In molti problemi con dati appaiati, il valore nullo è , cioè la variazione media è zero.
Quando un test t è appropriato
Un test t è una buona scelta quando tutte queste condizioni sono ragionevolmente vere:
- La variabile risposta è numerica.
- Le osservazioni sono indipendenti all’interno del disegno scelto, a meno che tu non stia usando intenzionalmente una struttura appaiata.
- La domanda riguarda una media o una differenza tra medie.
- Il campione non è così piccolo e distorto da outlier o forte asimmetria da rendere fuorvianti la media e la deviazione standard.
Se la deviazione standard della popolazione fosse nota esattamente, l’alternativa diretta da manuale sarebbe un test . In pratica, i test t sono comuni perché di solito è sconosciuta.
Esempio svolto: un test t a un campione
Supponiamo che un processo di confezionamento debba avere una media di grammi. Prendi un campione casuale di confezioni e trovi
Vuoi sapere se la vera media è diversa da grammi.
Poiché si tratta di un solo campione confrontato con un valore obiettivo, il test corretto è un test t a un campione.
Inizia con le ipotesi:
L’errore standard è
Ora calcola la statistica del test:
I gradi di libertà sono
Per un test a due code con , un valore di dà un p-value inferiore a . Questo significa che il risultato è statisticamente significativo al livello del , quindi rifiuti .
Nel contesto, il campione fornisce evidenza che la media del processo è diversa da grammi. Questa conclusione dipende dal fatto che il campione sia ragionevolmente indipendente e non fortemente distorto da outlier.
Errori comuni con i test t
Un errore comune è scegliere la versione sbagliata del test. Se le stesse persone, macchine o unità vengono misurate due volte, i dati sono appaiati, quindi un test t a due campioni indipendenti non è appropriato.
Un altro errore è interpretare “non statisticamente significativo” come “non c’è differenza”. Di solito significa che il campione non ha fornito evidenza abbastanza forte contro l’ipotesi nulla.
Un terzo errore è saltare il controllo dei dati. Con un campione minuscolo e un outlier estremo, la formula produce comunque un numero, ma la conclusione potrebbe non essere affidabile.
Dove si usano i test t
I test t sono comuni negli esperimenti, nel controllo qualità, in medicina, in psicologia, nell’istruzione e nei confronti in stile A/B quando la variabile di interesse è numerica. Sono uno dei punti di ingresso standard nell’inferenza statistica perché collegano medie, variabilità, incertezza e processo decisionale in un unico metodo.
Prova un problema simile
Modifica l’esempio in modo che la media campionaria sia invece di , mantenendo e . Ricalcola la statistica t e decidi se l’evidenza è ancora abbastanza forte al livello del . È un passaggio utile se vuoi vedere come cambia la conclusione quando la media campionaria si avvicina al valore nullo.
Hai bisogno di aiuto con un problema?
Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.
Apri GPAI Solver →