Test del chi quadrato

Un test del chi quadrato verifica se dati di conteggio categoriali si discostano troppo da ciò che un modello si aspetterebbe per puro caso. Si usa per conteggi in categorie, non per medie o misurazioni grezze.

L'idea di base è semplice: confrontare ciò che hai osservato con ciò che ti aspetteresti se l'ipotesi nulla fosse vera. Se le differenze sono abbastanza grandi, la statistica chi quadrato diventa grande e i dati costituiscono evidenza contro quel modello nullo.

Che cosa sta davvero confrontando il test

Nella configurazione più comune, hai conteggi osservati $O$ e conteggi attesi $E$ per ogni categoria. La statistica del test è

\chi^2 = \sum \frac{(O - E)^2}{E}

Questo numero cresce quando i conteggi osservati si allontanano di più da quelli attesi. Le discrepanze maggiori pesano di più, e le categorie con conteggi attesi più grandi vengono scalate di conseguenza.

I conteggi attesi non si scelgono a caso. Derivano dall'ipotesi nulla. In un test di bontà dell'adattamento, l'ipotesi nulla può dire che le categorie dovrebbero essere tutte ugualmente probabili. In un test di indipendenza, l'ipotesi nulla afferma che due variabili categoriali non sono correlate.

Due versioni comuni

L'espressione "test del chi quadrato" di solito si riferisce a una di queste:

Un test di bontà dell'adattamento, che chiede se una variabile categoriale segue una distribuzione dichiarata.
Un test di indipendenza, che chiede se due variabili categoriali sono associate in una tabella di contingenza.

In entrambi i casi si usa la stessa famiglia di statistiche, ma il modo in cui si calcolano i conteggi attesi dipende dalla versione.

Esempio svolto: bontà dell'adattamento

Supponiamo che un bar voglia sapere se tre formati di bevanda vengono scelti con la stessa frequenza. Su $60$ ordini, i conteggi osservati sono:

Piccola: $26$
Media: $18$
Grande: $16$

Se l'ipotesi nulla dice che tutti e tre i formati sono ugualmente probabili, il conteggio atteso in ogni categoria è

E = \frac{60}{3} = 20

Ora calcoliamo la statistica:

\chi^2 = \frac{(26-20)^2}{20} + \frac{(18-20)^2}{20} + \frac{(16-20)^2}{20}

= \frac{36}{20} + \frac{4}{20} + \frac{16}{20}

= 1.8 + 0.2 + 0.8 = 2.8

Questa è la statistica del test, non la conclusione finale da sola. Dovresti confrontare $\chi^2 = 2.8$ con una distribuzione chi quadrato con i gradi di libertà appropriati. Qui i gradi di libertà sono $3 - 1 = 2$ , perché ci sono tre categorie e nessun parametro è stato stimato dai dati. Con $df = 2$ , una statistica pari a $2.8$ non è un'evidenza forte contro una preferenza uguale al livello del $5\%$ .

In pratica, questo significa che i conteggi differiscono dall'uguaglianza perfetta, ma non abbastanza da poter dire con sicurezza che le preferenze reali siano diverse sulla base di questo solo campione.

Quando il test ha senso

Usa un test del chi quadrato quando tutte queste condizioni sono vere:

I tuoi dati sono un insieme di conteggi in categorie.
Le osservazioni sono indipendenti, o abbastanza vicine all'indipendenza per il modello che stai usando.
I conteggi attesi non sono troppo piccoli per l'approssimazione chi quadrato che intendi usare.

In molti contesti introduttivi, si usa la regola pratica secondo cui i conteggi attesi dovrebbero essere almeno circa $5$ in ogni categoria. È una linea guida pratica, non una legge universale, ma è un segnale d'allarme utile.

Errori comuni

Usare il test su medie, misurazioni o percentuali invece che su conteggi per categoria.
Trattare i conteggi osservati come se fossero quelli attesi. I conteggi attesi devono derivare dall'ipotesi nulla.
Ignorare conteggi attesi piccoli, che possono rendere inaffidabile la consueta approssimazione chi quadrato.
Pensare che "statisticamente significativo" significhi "importante nella pratica". Il test valuta solo l'evidenza contro il modello nullo.

Dove si usa

I test del chi quadrato compaiono in sondaggi, genetica, controllo qualità, ricerche di mercato e in qualsiasi contesto in cui gli esiti ricadono in categorie. Sono particolarmente comuni quando la vera domanda è se un certo schema sia sorprendente oppure se due variabili categoriali sembrino collegate.

Se i dati sono numerici anziché categoriali, di solito è meglio usare uno strumento diverso. Per esempio, il confronto tra medie porta spesso a un test $t$ o all'ANOVA.

Prova la tua versione

Prendi una piccola tabella di conteggi per categoria e scrivi l'ipotesi nulla prima di fare qualsiasi calcolo. Questo singolo passaggio di solito evita l'errore più grande nei problemi sul chi quadrato: usare la formula giusta con i conteggi attesi sbagliati.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →