Teste de Hipóteses

Teste de hipóteses é uma forma de perguntar se os dados de uma amostra parecem inconsistentes demais com uma afirmação inicial. Essa afirmação inicial é chamada de hipótese nula, escrita como $H_0$ .

O método não prova que $H_0$ é verdadeira ou falsa. Ele faz uma pergunta mais específica: se $H_0$ fosse verdadeira, dados tão extremos assim seriam incomuns o bastante para que devêssemos duvidar dela?

A Ideia Central

Todo teste de hipóteses tem duas afirmações concorrentes:

A hipótese nula $H_0$ , que é a afirmação padrão sendo testada.
A hipótese alternativa $H_1$ ou $H_a$ , que é o que você apoiaria se os dados fornecessem evidência suficiente contra $H_0$ .

Depois, você escolhe um nível de significância $\alpha$ , muitas vezes $0.05$ , antes de olhar o resultado. Esse é o limite que define quanta evidência você exige antes de rejeitar $H_0$ .

Dois resultados são possíveis:

Rejeitar $H_0$ : os dados são suficientemente inconsistentes com o modelo nulo.
Não rejeitar $H_0$ : os dados não são fortes o bastante para descartar o modelo nulo.

"Não rejeitar" não é o mesmo que "aceitar como verdadeiro". Significa apenas que a amostra não forneceu evidência forte o suficiente contra $H_0$ .

As Etapas Mais Comuns

O processo normalmente é:

Definir $H_0$ e $H_1$ com clareza.
Escolher $\alpha$ e um teste compatível com os dados e com as suposições.
Calcular uma estatística de teste a partir da amostra.
Transformar essa estatística em um valor- $p$ ou compará-la com um valor crítico.
Tomar a decisão e interpretá-la no contexto.

A estatística de teste depende da situação. Teste $z$ , teste $t$ , teste qui-quadrado e muitos outros são exemplos de testes de hipóteses. Não existe uma fórmula única para todo teste de hipóteses.

O Que Significa o Valor- $p$

Um valor- $p$ é a probabilidade, supondo que $H_0$ seja verdadeira e que as suposições do teste sejam válidas, de obter um resultado pelo menos tão extremo quanto o observado.

Um valor- $p$ pequeno significa que os dados seriam incomuns sob $H_0$ . É por isso que valores- $p$ pequenos contam como evidência contra a hipótese nula.

Isso não significa:

A probabilidade de $H_0$ ser falsa.
A probabilidade de seu resultado ter acontecido "por acaso" em um sentido vago do dia a dia.
O tamanho ou a importância do efeito.

Principais Tipos de Testes de Hipóteses

Há duas formas úteis de agrupar os testes.

Pela Direção

Um teste unilateral procura mudança em apenas uma direção.

Unilateral à direita: valores maiores que a afirmação nula apoiam $H_1$ .
Unilateral à esquerda: valores menores que a afirmação nula apoiam $H_1$ .

Um teste bilateral procura uma diferença em qualquer direção. Se $H_1$ for "diferente de", a região de rejeição fica dividida entre as duas caudas.

Pela Situação dos Dados

Um teste $z$ é usado em alguns casos de teste de média quando o desvio padrão populacional é conhecido ou quando se usa uma aproximação justificável por amostra grande.
Um teste $t$ é comum para médias quando o desvio padrão populacional é desconhecido e as condições são razoáveis.
Um teste qui-quadrado é usado para dados categóricos de contagem.

O teste correto depende do tipo de variável, do desenho amostral e das suposições. Escolher a fórmula primeiro e a pergunta depois é um erro comum.

Exemplo Resolvido

Suponha que uma máquina de envase deva ter média de $500$ mL por garrafa. Uma equipe de controle de qualidade coleta uma amostra de $36$ garrafas e obtém média amostral de $496$ mL.

Suponha, neste exemplo, que o desvio padrão populacional seja conhecido e igual a $\sigma = 12$ mL e que as condições de amostragem justifiquem um teste $z$ para uma amostra.

Monte as hipóteses:

H_0: \mu = 500

H_1: \mu < 500

Este é um teste unilateral à esquerda porque a preocupação é o subenvase.

O erro padrão é

\frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{36}} = 2

Então, a estatística de teste é

z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{496 - 500}{2} = -2

Se $\alpha = 0.05$ para um teste $z$ unilateral à esquerda, o valor crítico é aproximadamente $-1.645$ . Como $-2 < -1.645$ , o resultado cai na região de rejeição.

Portanto, a decisão é rejeitar $H_0$ ao nível de $5\%$ . No contexto, a amostra fornece evidência de que a máquina está enchendo abaixo da média esperada.

Essa conclusão depende das suposições do teste. Se as suposições forem ruins, a conclusão pode não ser confiável, mesmo que a conta esteja correta.

Erros Tipo I e Tipo II

Todo teste de hipóteses envolve risco de erro.

Um erro Tipo I significa rejeitar $H_0$ mesmo quando ela é verdadeira. Sua probabilidade é controlada por $\alpha$ .

Um erro Tipo II significa não rejeitar $H_0$ mesmo quando $H_1$ é verdadeira. Sua probabilidade geralmente é representada por $\beta$ .

Reduzir $\alpha$ torna alarmes falsos menos prováveis, mas também pode dificultar a detecção de efeitos reais se nada mais mudar. Essa troca é uma das razões pelas quais o tamanho da amostra importa.

Erros Comuns

Um erro comum é dizer que um resultado não significativo prova que não existe efeito. Em geral, isso apenas mostra que os dados não foram fortes o bastante para detectar um.

Outro erro é tratar significância estatística como importância prática. Um efeito muito pequeno pode ser estatisticamente significativo em uma amostra muito grande.

As pessoas também usam testes de forma inadequada ao ignorar suposições sobre independência, formato da distribuição, variância ou tipo de dado. Um valor- $p$ com aparência convincente não salva um teste mal escolhido.

Quando o Teste de Hipóteses É Usado

O teste de hipóteses é usado na ciência, na manufatura, na medicina, em pesquisas, em testes A/B e em análise de políticas públicas. O objetivo geralmente é o mesmo: decidir se a amostra fornece evidência suficiente para questionar uma afirmação padrão.

Na prática, um bom teste não depende só do cálculo. Ele também exige uma hipótese nula sensata, um desenho defensável e uma interpretação compatível com o que o teste realmente pode dizer.

Tente Sua Própria Versão

Use o mesmo exemplo do envase das garrafas, mas mude a média amostral para $498$ mL. Recalcule a estatística de teste e veja se a decisão muda em $\alpha = 0.05$ . Essa é uma forma rápida de perceber como a evidência fica mais forte ou mais fraca à medida que o resultado da amostra se aproxima do valor nulo.

Precisa de ajuda com um problema?

Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.

Abrir GPAI Solver →