Prueba de chi cuadrado

Una prueba de chi cuadrado evalúa si los datos de conteo en categorías se alejan demasiado de lo que un modelo esperaría solo por azar. Se usa para conteos en categorías, no para promedios ni mediciones directas.

La idea central es simple: comparar lo que observaste con lo que esperarías si la hipótesis nula fuera cierta. Si las diferencias son lo bastante grandes, el estadístico chi cuadrado también será grande, y los datos cuentan como evidencia contra ese modelo nulo.

Qué está comparando realmente la prueba

En la configuración más común, tienes conteos observados $O$ y conteos esperados $E$ para cada categoría. El estadístico de prueba es

\chi^2 = \sum \frac{(O - E)^2}{E}

Este número aumenta cuando los conteos observados se alejan más de los esperados. Las discrepancias mayores pesan más, y las categorías con conteos esperados más grandes se ajustan en consecuencia.

Los conteos esperados no se eligen al azar. Provienen de la hipótesis nula. En una prueba de bondad de ajuste, la hipótesis nula puede decir que las categorías deberían ser igual de probables. En una prueba de independencia, la hipótesis nula dice que dos variables categóricas no están relacionadas.

Dos versiones comunes

La expresión "prueba de chi cuadrado" normalmente se refiere a una de estas:

Una prueba de bondad de ajuste, que pregunta si una variable categórica sigue una distribución propuesta.
Una prueba de independencia, que pregunta si dos variables categóricas están asociadas en una tabla de contingencia.

En ambos casos se usa la misma familia de estadísticos, pero la forma de calcular los conteos esperados depende de la versión.

Ejemplo resuelto: bondad de ajuste

Supón que una cafetería quiere saber si se eligen con la misma frecuencia tres tamaños de bebida. En $60$ pedidos, los conteos observados son:

Pequeño: $26$
Mediano: $18$
Grande: $16$

Si la hipótesis nula dice que los tres tamaños son igual de probables, el conteo esperado en cada categoría es

E = \frac{60}{3} = 20

Ahora calcula el estadístico:

\chi^2 = \frac{(26-20)^2}{20} + \frac{(18-20)^2}{20} + \frac{(16-20)^2}{20}

= \frac{36}{20} + \frac{4}{20} + \frac{16}{20}

= 1.8 + 0.2 + 0.8 = 2.8

Ese es el estadístico de prueba, pero no la conclusión final por sí solo. Debes comparar $\chi^2 = 2.8$ con una distribución chi cuadrado con los grados de libertad adecuados. Aquí los grados de libertad son $3 - 1 = 2$ , porque hay tres categorías y no se estimó ningún parámetro a partir de los datos. Con $df = 2$ , un estadístico de $2.8$ no es evidencia fuerte contra la preferencia igual al nivel del $5\%$ .

La interpretación práctica es: los conteos difieren de una igualdad perfecta, pero no lo suficiente como para afirmar con confianza que las preferencias reales son desiguales basándose solo en esta muestra.

Cuándo tiene sentido usar la prueba

Usa una prueba de chi cuadrado cuando se cumplan todas estas condiciones:

Tus datos son un conjunto de conteos en categorías.
Las observaciones son independientes, o lo bastante cercanas a serlo para el modelo que estás usando.
Los conteos esperados no son demasiado pequeños para la aproximación chi cuadrado que planeas usar.

En muchos cursos introductorios, se usa la regla práctica de que los conteos esperados deberían ser al menos de alrededor de $5$ en cada categoría. Es una guía práctica, no una ley universal, pero sirve como señal de advertencia útil.

Errores comunes

Usar la prueba con medias, mediciones o porcentajes en lugar de conteos por categoría.
Tratar los conteos observados como si fueran los esperados. Los conteos esperados deben venir de la hipótesis nula.
Ignorar conteos esperados pequeños, lo que puede hacer que la aproximación chi cuadrado habitual no sea fiable.
Pensar que "estadísticamente significativo" significa "importante en la práctica". La prueba solo evalúa la evidencia contra el modelo nulo.

Dónde aparece

Las pruebas de chi cuadrado aparecen en encuestas, genética, control de calidad, investigación de mercados y cualquier contexto en el que los resultados caen en categorías. Son especialmente comunes cuando la pregunta real es si un patrón es sorprendente o si dos variables categóricas parecen estar relacionadas.

Si los datos son numéricos en lugar de categóricos, normalmente conviene usar otra herramienta. Por ejemplo, comparar medias suele llevar a una prueba $t$ o a ANOVA.

Prueba tu propia versión

Toma una tabla pequeña de conteos por categoría y escribe la hipótesis nula antes de hacer cualquier cálculo. Ese solo paso suele evitar el error más grande en los problemas de chi cuadrado: usar la fórmula correcta con conteos esperados incorrectos.

¿Necesitas ayuda con un problema?

Sube tu pregunta y obtén una solución verificada, paso a paso, en segundos.

Abrir GPAI Solver →