Teste de hipóteses é uma forma de perguntar se os dados de uma amostra parecem inconsistentes demais com uma afirmação inicial. Essa afirmação inicial é chamada de hipótese nula, escrita como H0H_0.

O método não prova que H0H_0 é verdadeira ou falsa. Ele faz uma pergunta mais específica: se H0H_0 fosse verdadeira, dados tão extremos assim seriam incomuns o bastante para que devêssemos duvidar dela?

A Ideia Central

Todo teste de hipóteses tem duas afirmações concorrentes:

  1. A hipótese nula H0H_0, que é a afirmação padrão sendo testada.
  2. A hipótese alternativa H1H_1 ou HaH_a, que é o que você apoiaria se os dados fornecessem evidência suficiente contra H0H_0.

Depois, você escolhe um nível de significância α\alpha, muitas vezes 0.050.05, antes de olhar o resultado. Esse é o limite que define quanta evidência você exige antes de rejeitar H0H_0.

Dois resultados são possíveis:

  1. Rejeitar H0H_0: os dados são suficientemente inconsistentes com o modelo nulo.
  2. Não rejeitar H0H_0: os dados não são fortes o bastante para descartar o modelo nulo.

"Não rejeitar" não é o mesmo que "aceitar como verdadeiro". Significa apenas que a amostra não forneceu evidência forte o suficiente contra H0H_0.

As Etapas Mais Comuns

O processo normalmente é:

  1. Definir H0H_0 e H1H_1 com clareza.
  2. Escolher α\alpha e um teste compatível com os dados e com as suposições.
  3. Calcular uma estatística de teste a partir da amostra.
  4. Transformar essa estatística em um valor-pp ou compará-la com um valor crítico.
  5. Tomar a decisão e interpretá-la no contexto.

A estatística de teste depende da situação. Teste zz, teste tt, teste qui-quadrado e muitos outros são exemplos de testes de hipóteses. Não existe uma fórmula única para todo teste de hipóteses.

O Que Significa o Valor-pp

Um valor-pp é a probabilidade, supondo que H0H_0 seja verdadeira e que as suposições do teste sejam válidas, de obter um resultado pelo menos tão extremo quanto o observado.

Um valor-pp pequeno significa que os dados seriam incomuns sob H0H_0. É por isso que valores-pp pequenos contam como evidência contra a hipótese nula.

Isso não significa:

  1. A probabilidade de H0H_0 ser falsa.
  2. A probabilidade de seu resultado ter acontecido "por acaso" em um sentido vago do dia a dia.
  3. O tamanho ou a importância do efeito.

Principais Tipos de Testes de Hipóteses

Há duas formas úteis de agrupar os testes.

Pela Direção

Um teste unilateral procura mudança em apenas uma direção.

  • Unilateral à direita: valores maiores que a afirmação nula apoiam H1H_1.
  • Unilateral à esquerda: valores menores que a afirmação nula apoiam H1H_1.

Um teste bilateral procura uma diferença em qualquer direção. Se H1H_1 for "diferente de", a região de rejeição fica dividida entre as duas caudas.

Pela Situação dos Dados

  • Um teste zz é usado em alguns casos de teste de média quando o desvio padrão populacional é conhecido ou quando se usa uma aproximação justificável por amostra grande.
  • Um teste tt é comum para médias quando o desvio padrão populacional é desconhecido e as condições são razoáveis.
  • Um teste qui-quadrado é usado para dados categóricos de contagem.

O teste correto depende do tipo de variável, do desenho amostral e das suposições. Escolher a fórmula primeiro e a pergunta depois é um erro comum.

Exemplo Resolvido

Suponha que uma máquina de envase deva ter média de 500500 mL por garrafa. Uma equipe de controle de qualidade coleta uma amostra de 3636 garrafas e obtém média amostral de 496496 mL.

Suponha, neste exemplo, que o desvio padrão populacional seja conhecido e igual a σ=12\sigma = 12 mL e que as condições de amostragem justifiquem um teste zz para uma amostra.

Monte as hipóteses:

H0:μ=500H_0: \mu = 500 H1:μ<500H_1: \mu < 500

Este é um teste unilateral à esquerda porque a preocupação é o subenvase.

O erro padrão é

σn=1236=2\frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{36}} = 2

Então, a estatística de teste é

z=xˉμ0σ/n=4965002=2z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{496 - 500}{2} = -2

Se α=0.05\alpha = 0.05 para um teste zz unilateral à esquerda, o valor crítico é aproximadamente 1.645-1.645. Como 2<1.645-2 < -1.645, o resultado cai na região de rejeição.

Portanto, a decisão é rejeitar H0H_0 ao nível de 5%5\%. No contexto, a amostra fornece evidência de que a máquina está enchendo abaixo da média esperada.

Essa conclusão depende das suposições do teste. Se as suposições forem ruins, a conclusão pode não ser confiável, mesmo que a conta esteja correta.

Erros Tipo I e Tipo II

Todo teste de hipóteses envolve risco de erro.

Um erro Tipo I significa rejeitar H0H_0 mesmo quando ela é verdadeira. Sua probabilidade é controlada por α\alpha.

Um erro Tipo II significa não rejeitar H0H_0 mesmo quando H1H_1 é verdadeira. Sua probabilidade geralmente é representada por β\beta.

Reduzir α\alpha torna alarmes falsos menos prováveis, mas também pode dificultar a detecção de efeitos reais se nada mais mudar. Essa troca é uma das razões pelas quais o tamanho da amostra importa.

Erros Comuns

Um erro comum é dizer que um resultado não significativo prova que não existe efeito. Em geral, isso apenas mostra que os dados não foram fortes o bastante para detectar um.

Outro erro é tratar significância estatística como importância prática. Um efeito muito pequeno pode ser estatisticamente significativo em uma amostra muito grande.

As pessoas também usam testes de forma inadequada ao ignorar suposições sobre independência, formato da distribuição, variância ou tipo de dado. Um valor-pp com aparência convincente não salva um teste mal escolhido.

Quando o Teste de Hipóteses É Usado

O teste de hipóteses é usado na ciência, na manufatura, na medicina, em pesquisas, em testes A/B e em análise de políticas públicas. O objetivo geralmente é o mesmo: decidir se a amostra fornece evidência suficiente para questionar uma afirmação padrão.

Na prática, um bom teste não depende só do cálculo. Ele também exige uma hipótese nula sensata, um desenho defensável e uma interpretação compatível com o que o teste realmente pode dizer.

Tente Sua Própria Versão

Use o mesmo exemplo do envase das garrafas, mas mude a média amostral para 498498 mL. Recalcule a estatística de teste e veja se a decisão muda em α=0.05\alpha = 0.05. Essa é uma forma rápida de perceber como a evidência fica mais forte ou mais fraca à medida que o resultado da amostra se aproxima do valor nulo.

Precisa de ajuda com um problema?

Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.

Abrir GPAI Solver →