Teste qui-quadrado

Um teste qui-quadrado verifica se dados categóricos de contagem estão distantes demais do que um modelo esperaria apenas pelo acaso. Ele é usado para contagens em categorias, não para médias nem para medidas brutas.

A ideia central é simples: comparar o que você observou com o que esperaria se a hipótese nula fosse verdadeira. Se as diferenças forem grandes o suficiente, a estatística qui-quadrado fica grande, e os dados passam a contar como evidência contra esse modelo nulo.

O Que o Teste Está Comparando de Fato

Na configuração mais comum, você tem contagens observadas $O$ e contagens esperadas $E$ para cada categoria. A estatística do teste é

\chi^2 = \sum \frac{(O - E)^2}{E}

Esse número aumenta quando as contagens observadas se afastam mais das contagens esperadas. Diferenças maiores pesam mais, e categorias com contagens esperadas maiores são ajustadas de acordo.

As contagens esperadas não são escolhidas ao acaso. Elas vêm da hipótese nula. Em um teste de aderência, a hipótese nula pode dizer que as categorias devem ser igualmente prováveis. Em um teste de independência, a hipótese nula diz que duas variáveis categóricas não têm relação.

Duas Versões Comuns

A expressão "teste qui-quadrado" geralmente se refere a uma destas opções:

Um teste de aderência, que pergunta se uma variável categórica segue uma distribuição proposta.
Um teste de independência, que pergunta se duas variáveis categóricas estão associadas em uma tabela de contingência.

A mesma família de estatísticas é usada nos dois casos, mas a forma de calcular as contagens esperadas depende da versão.

Exemplo Resolvido: Teste de Aderência

Suponha que uma cafeteria queira saber se três tamanhos de bebida são escolhidos com a mesma frequência. Em $60$ pedidos, as contagens observadas são:

Pequeno: $26$
Médio: $18$
Grande: $16$

Se a hipótese nula diz que os três tamanhos são igualmente prováveis, a contagem esperada em cada categoria é

E = \frac{60}{3} = 20

Agora calcule a estatística:

\chi^2 = \frac{(26-20)^2}{20} + \frac{(18-20)^2}{20} + \frac{(16-20)^2}{20}

= \frac{36}{20} + \frac{4}{20} + \frac{16}{20}

= 1.8 + 0.2 + 0.8 = 2.8

Essa é a estatística do teste, não a conclusão final por si só. Você compararia $\chi^2 = 2.8$ com uma distribuição qui-quadrado com os graus de liberdade apropriados. Aqui os graus de liberdade são $3 - 1 = 2$ , porque há três categorias e nenhum parâmetro foi estimado a partir dos dados. Com $df = 2$ , uma estatística de $2.8$ não é evidência forte contra preferência igual no nível de $5\%$ .

Na prática, a leitura é: as contagens diferem da igualdade perfeita, mas não o suficiente para afirmar com confiança que as preferências reais são desiguais com base apenas nesta amostra.

Quando o Teste Faz Sentido

Use um teste qui-quadrado quando tudo isso for verdadeiro:

Seus dados são um conjunto de contagens em categorias.
As observações são independentes, ou suficientemente próximas disso para o modelo que você está usando.
As contagens esperadas não são pequenas demais para a aproximação qui-quadrado que você pretende usar.

Em muitos contextos introdutórios, usa-se a regra prática de que as contagens esperadas devem ser de pelo menos cerca de $5$ em cada categoria. Isso é uma orientação prática, não uma lei universal, mas é um sinal de alerta útil.

Erros Comuns

Usar o teste para médias, medidas ou porcentagens em vez de contagens por categoria.
Tratar as contagens observadas como se fossem as contagens esperadas. As contagens esperadas devem vir da hipótese nula.
Ignorar contagens esperadas pequenas, o que pode tornar a aproximação qui-quadrado usual pouco confiável.
Achar que "estatisticamente significativo" quer dizer "importante na prática". O teste só avalia evidência contra o modelo nulo.

Onde Você Encontra Esse Teste

Os testes qui-quadrado aparecem em pesquisas, genética, controle de qualidade, pesquisa de mercado e em qualquer contexto em que os resultados caiam em categorias. Eles são especialmente comuns quando a pergunta real é se um padrão é surpreendente ou se duas variáveis categóricas parecem estar relacionadas.

Se os dados forem numéricos em vez de categóricos, normalmente outra ferramenta é melhor. Por exemplo, comparar médias costuma levar a um teste $t$ ou a uma ANOVA.

Tente Sua Própria Versão

Pegue uma pequena tabela de contagens por categoria e escreva a hipótese nula antes de fazer qualquer conta. Esse único passo geralmente evita o maior erro em problemas de qui-quadrado: usar a fórmula certa com as contagens esperadas erradas.

Precisa de ajuda com um problema?

Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.

Abrir GPAI Solver →