Prueba de hipótesis

La prueba de hipótesis es una forma de preguntar si los datos de una muestra parecen demasiado inconsistentes con una afirmación inicial. Esa afirmación inicial se llama hipótesis nula y se escribe $H_0$ .

Este método no demuestra que $H_0$ sea verdadera o falsa. Plantea una pregunta más concreta: si $H_0$ fuera verdadera, ¿unos datos tan extremos serían lo bastante inusuales como para que debamos dudar de ella?

La idea central

Toda prueba de hipótesis tiene dos afirmaciones que compiten entre sí:

La hipótesis nula $H_0$ , que es la afirmación por defecto que se pone a prueba.
La hipótesis alternativa $H_1$ o $H_a$ , que es la que apoyarías si los datos aportan suficiente evidencia contra $H_0$ .

Luego eliges un nivel de significancia $\alpha$ , a menudo $0.05$ , antes de ver el resultado. Este es el umbral de evidencia que exiges antes de rechazar $H_0$ .

Hay dos resultados posibles:

Rechazar $H_0$ : los datos son suficientemente inconsistentes con el modelo nulo.
No rechazar $H_0$ : los datos no son lo bastante fuertes como para descartar el modelo nulo.

"No rechazar" no es lo mismo que "aceptar como verdadera". Solo significa que la muestra no aportó evidencia suficientemente fuerte contra $H_0$ .

Los pasos habituales

El procedimiento suele ser:

Plantear con claridad $H_0$ y $H_1$ .
Elegir $\alpha$ y una prueba que se ajuste a los datos y a los supuestos.
Calcular un estadístico de prueba a partir de la muestra.
Convertir ese estadístico en un valor $p$ o compararlo con un valor crítico.
Tomar la decisión e interpretarla en contexto.

El estadístico de prueba depende de la situación. Una prueba $z$ , una prueba $t$ , una prueba de chi-cuadrado y muchas otras son ejemplos de pruebas de hipótesis. No existe una sola fórmula para toda prueba de hipótesis.

Qué significa el valor $p$

Un valor $p$ es la probabilidad, suponiendo que $H_0$ es verdadera y que se cumplen los supuestos de la prueba, de obtener un resultado al menos tan extremo como el observado.

Un valor $p$ pequeño significa que los datos serían inusuales bajo $H_0$ . Por eso los valores $p$ pequeños cuentan como evidencia contra la hipótesis nula.

No significa:

La probabilidad de que $H_0$ sea falsa.
La probabilidad de que tu resultado haya ocurrido "por azar" en un sentido cotidiano y vago.
El tamaño o la importancia del efecto.

Tipos principales de pruebas de hipótesis

Hay dos formas útiles de agrupar las pruebas.

Según la dirección

Una prueba unilateral busca cambio en una sola dirección.

Cola derecha: los valores mayores que la afirmación nula apoyan $H_1$ .
Cola izquierda: los valores menores que la afirmación nula apoyan $H_1$ .

Una prueba bilateral busca una diferencia en cualquiera de las dos direcciones. Si $H_1$ es "distinto de", la región de rechazo se divide entre ambas colas.

Según la situación de los datos

Una prueba $z$ se usa en algunos casos de contraste de medias cuando la desviación estándar poblacional es conocida o se usa una aproximación justificada con muestra grande.
Una prueba $t$ es común para medias cuando la desviación estándar poblacional es desconocida y las condiciones son razonables.
Una prueba de chi-cuadrado se usa para datos categóricos de conteos.

La prueba correcta depende del tipo de variable, del diseño muestral y de los supuestos. Elegir primero la fórmula y después la pregunta es un error común.

Ejemplo resuelto

Supón que una máquina llenadora debería promediar $500$ mL por botella. Un equipo de control de calidad toma una muestra de $36$ botellas y obtiene una media muestral de $496$ mL.

Supón, para este ejemplo, que la desviación estándar poblacional es conocida y vale $\sigma = 12$ mL, y que las condiciones de muestreo justifican una prueba $z$ de una muestra.

Planteamos las hipótesis:

H_0: \mu = 500

H_1: \mu < 500

Esta es una prueba de cola izquierda porque la preocupación es el llenado insuficiente.

El error estándar es

\frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{36}} = 2

Entonces el estadístico de prueba es

z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{496 - 500}{2} = -2

Si $\alpha = 0.05$ para una prueba $z$ de cola izquierda, el valor crítico es aproximadamente $-1.645$ . Como $-2 < -1.645$ , el resultado cae en la región de rechazo.

Así que la decisión es rechazar $H_0$ al nivel del $5\%$ . En contexto, la muestra aporta evidencia de que la máquina está llenando por debajo del promedio esperado.

Esa conclusión depende de los supuestos de la prueba. Si los supuestos no son adecuados, la conclusión puede ser poco fiable aunque la aritmética sea correcta.

Error de tipo I y error de tipo II

La prueba de hipótesis siempre implica riesgo de error.

Un error de tipo I significa rechazar $H_0$ aunque sea verdadera. Su probabilidad está controlada por $\alpha$ .

Un error de tipo II significa no rechazar $H_0$ aunque $H_1$ sea verdadera. Su probabilidad suele escribirse como $\beta$ .

Reducir $\alpha$ hace menos probables las falsas alarmas, pero también puede hacer más difícil detectar efectos reales si nada más cambia. Ese equilibrio es una de las razones por las que el tamaño de la muestra importa.

Errores comunes

Un error común es decir que un resultado no significativo demuestra que no hay efecto. Normalmente solo muestra que los datos no fueron lo bastante fuertes para detectarlo.

Otro error es tratar la significancia estadística como si fuera importancia práctica. Un efecto muy pequeño puede ser estadísticamente significativo en una muestra muy grande.

También se usan mal las pruebas cuando se ignoran supuestos sobre independencia, forma de la distribución, varianza o tipo de datos. Un valor $p$ que parece limpio no salva una prueba mal elegida.

Cuándo se usa la prueba de hipótesis

La prueba de hipótesis se usa en ciencia, manufactura, medicina, encuestas, pruebas A/B y análisis de políticas públicas. El objetivo suele ser el mismo: decidir si la muestra aporta suficiente evidencia para cuestionar una afirmación por defecto.

En la práctica, una buena prueba no consiste solo en el cálculo. También requiere una hipótesis nula sensata, un diseño defendible y una interpretación que coincida con lo que la prueba realmente puede decir.

Prueba tu propia versión

Toma el mismo ejemplo del llenado de botellas, pero cambia la media muestral a $498$ mL. Vuelve a calcular el estadístico de prueba y observa si la decisión cambia con $\alpha = 0.05$ . Es una forma rápida de ver cómo la evidencia se vuelve más fuerte o más débil a medida que el resultado muestral se acerca al valor nulo.

¿Necesitas ayuda con un problema?

Sube tu pregunta y obtén una solución verificada, paso a paso, en segundos.

Abrir GPAI Solver →