Un diagrama de caja y bigotes muestra de un vistazo el centro, la dispersión y la posible asimetría de un conjunto de datos. Se construye a partir del resumen de cinco números: mínimo, primer cuartil Q1Q_1, mediana, tercer cuartil Q3Q_3 y máximo. Si tu clase o software usa la regla de 1.5×IQR1.5 \times IQR, los bigotes pueden detenerse en los valores no atípicos más extremos en lugar del mínimo y el máximo absolutos.

La caja va de Q1Q_1 a Q3Q_3, así que contiene el 50%50\% central de los datos. La línea dentro de la caja es la mediana. Los bigotes muestran hasta dónde se extienden los datos más allá de esa mitad central.

Qué muestra un diagrama de caja y bigotes

Un diagrama de caja te ayuda a responder tres preguntas rápidas:

  • ¿Dónde está el centro? Mira la mediana.
  • ¿Qué tan dispersa está la mitad central? Mira el ancho de la caja.
  • ¿Están equilibradas las colas? Compara los dos bigotes.

El ancho de la caja es el rango intercuartílico, o IQR=Q3Q1IQR = Q_3 - Q_1. Un IQRIQR más grande significa que la mitad central de los datos está más dispersa. Si un bigote es mucho más largo que el otro, los datos pueden estar sesgados en esa dirección.

Muchos diagramas de caja también usan la regla de 1.5×IQR1.5 \times IQR para marcar posibles valores atípicos. En esa versión, los bigotes se detienen en los valores no atípicos más extremos. Por eso, dos diagramas de caja correctos para los mismos datos pueden verse ligeramente diferentes si usan reglas distintas para los bigotes.

Ejemplo resuelto: de los datos al diagrama de caja

Usa el conjunto de datos ordenado

3, 5, 6, 7, 8, 9, 12, 153,\ 5,\ 6,\ 7,\ 8,\ 9,\ 12,\ 15

Hay 88 valores, así que la mediana es el promedio de los dos valores centrales:

median=7+82=7.5\text{median} = \frac{7 + 8}{2} = 7.5

Como hay un número par de datos, divide la lista en dos mitades iguales. La mitad inferior es 3,5,6,73, 5, 6, 7, así que

Q1=5+62=5.5Q_1 = \frac{5 + 6}{2} = 5.5

La mitad superior es 8,9,12,158, 9, 12, 15, así que

Q3=9+122=10.5Q_3 = \frac{9 + 12}{2} = 10.5

Eso da el resumen de cinco números:

min=3,Q1=5.5,median=7.5,Q3=10.5,max=15\text{min} = 3,\quad Q_1 = 5.5,\quad \text{median} = 7.5,\quad Q_3 = 10.5,\quad \text{max} = 15

Ahora calcula el rango intercuartílico:

IQR=Q3Q1=10.55.5=5IQR = Q_3 - Q_1 = 10.5 - 5.5 = 5

Si usas la regla común de valores atípicos de 1.5×IQR1.5 \times IQR, los límites son

Q11.5(IQR)=5.57.5=2Q_1 - 1.5(IQR) = 5.5 - 7.5 = -2

y

Q3+1.5(IQR)=10.5+7.5=18Q_3 + 1.5(IQR) = 10.5 + 7.5 = 18

Todos los valores de los datos están entre 2-2 y 1818, así que no hay posibles valores atípicos según esa regla. Para este conjunto de datos, la caja iría de 5.55.5 a 10.510.5, la línea de la mediana estaría en 7.57.5 y los bigotes llegarían a 33 y 1515.

Cómo leer rápidamente un diagrama de caja

Empieza con la línea de la mediana. Eso te dice dónde se encuentra el centro de los datos.

Luego compara el ancho de la caja y las longitudes de los bigotes. La caja muestra dónde está el 50%50\% central de los valores, mientras que los bigotes muestran hasta dónde se extienden las colas más allá de esa región.

Por último, busca asimetría. Si la mediana está descentrada dentro de la caja, o si un bigote es mucho más largo que el otro, la distribución puede no estar equilibrada alrededor del centro.

Errores comunes con los diagramas de caja y bigotes

Un error común es interpretar los bordes de la caja como el mínimo y el máximo. Normalmente representan Q1Q_1 y Q3Q_3, no los extremos del conjunto completo de datos.

Otro error es suponer que todos los diagramas de caja usan la misma regla para los bigotes. Algunos bigotes se extienden hasta el mínimo y el máximo. Otros se detienen en los valores no atípicos más extremos.

También es fácil olvidar que los cuartiles dependen de datos ordenados. Si los valores no se ordenan primero, los cuartiles y la mediana serán incorrectos.

Cuándo son útiles los diagramas de caja

Los diagramas de caja y bigotes son útiles cuando quieres un resumen rápido de una distribución en lugar de una lista completa de valores. Son comunes en clases de estadística, resúmenes de experimentos, control de calidad y comparaciones entre grupos.

Son especialmente útiles cuando importan los valores atípicos o la asimetría, porque la mediana y los cuartiles suelen ser más estables que la media por sí sola.

Prueba con un conjunto de datos similar

Toma un conjunto corto de datos ordenados, escribe su resumen de cinco números y dibuja la caja antes de preocuparte por los valores atípicos. Si quieres comprobar tus cuartiles y tu mediana en un problema de estadística similar, prueba tu propia versión en un solucionador después de haber preparado tú mismo la lista ordenada.

¿Necesitas ayuda con un problema?

Sube tu pregunta y obtén una solución verificada, paso a paso, en segundos.

Abrir GPAI Solver →