Las medidas de dispersión te dicen qué tan disperso está un conjunto de datos. Las tres medidas básicas son el rango, la varianza y la desviación estándar. El rango usa solo los valores más bajo y más alto, la varianza mide la distancia cuadrática promedio respecto de la media, y la desviación estándar es la raíz cuadrada de la varianza, por lo que devuelve la dispersión a las unidades originales.

Si quieres la idea rápida, usa el rango para una revisión veloz, la varianza para trabajo estadístico formal y la desviación estándar cuando quieras una medida de dispersión más fácil de interpretar.

Rango, varianza y desviación estándar de un vistazo

El rango es la distancia entre el mínimo y el máximo:

range=maximumminimum\text{range} = \text{maximum} - \text{minimum}

Es rápido de calcular, pero solo usa dos valores. Un valor extremo puede cambiarlo mucho.

La varianza mide qué tan lejos suelen estar los valores de la media después de elevar al cuadrado esas distancias.

Para una población completa,

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

Para una muestra usada para estimar una población mayor,

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

Usa NN solo cuando tus datos sean toda la población que te interesa. Usa n1n-1 cuando tus datos sean una muestra de un grupo más grande.

La desviación estándar es la raíz cuadrada de la varianza:

σ=σ2\sigma = \sqrt{\sigma^2}

o, para una muestra,

s=s2s = \sqrt{s^2}

Como está en las unidades originales, la desviación estándar suele ser más fácil de leer que la varianza.

Ejemplo resuelto: mismo rango, distinta dispersión

Compara estos dos conjuntos de datos:

  • Conjunto A: 2,5,5,5,82, 5, 5, 5, 8
  • Conjunto B: 2,2,5,8,82, 2, 5, 8, 8

Ambos tienen el mismo mínimo, el mismo máximo y la misma media.

Para cada conjunto,

range=82=6\text{range} = 8 - 2 = 6

y

mean=255=5\text{mean} = \frac{25}{5} = 5

Así que el rango por sí solo dice que tienen la misma amplitud. Pero los valores están distribuidos de forma distinta alrededor de la media.

Conjunto A

Las desviaciones respecto de la media son

3, 0, 0, 0, 3-3,\ 0,\ 0,\ 0,\ 3

Al elevarlas al cuadrado se obtiene

9, 0, 0, 0, 99,\ 0,\ 0,\ 0,\ 9

La suma de las desviaciones al cuadrado es 1818. Si tratamos los datos como una población,

σ2=185=3.6\sigma^2 = \frac{18}{5} = 3.6

y

σ=3.61.90\sigma = \sqrt{3.6} \approx 1.90

Conjunto B

Las desviaciones respecto de la media son

3, 3, 0, 3, 3-3,\ -3,\ 0,\ 3,\ 3

Al elevarlas al cuadrado se obtiene

9, 9, 0, 9, 99,\ 9,\ 0,\ 9,\ 9

La suma de las desviaciones al cuadrado es 3636, así que

σ2=365=7.2\sigma^2 = \frac{36}{5} = 7.2

y

σ=7.22.68\sigma = \sqrt{7.2} \approx 2.68

Ambos conjuntos tienen el mismo rango, pero el Conjunto B tiene mayor varianza y mayor desviación estándar. Esa es la idea clave: el rango solo ve los extremos, mientras que la varianza y la desviación estándar usan todo el conjunto de datos.

Errores comunes con las medidas de dispersión

Un error común es suponer que el mismo rango significa la misma dispersión. El ejemplo anterior muestra por qué eso es falso.

Otro error es tratar la varianza como si estuviera en las unidades originales. No lo está. Si los datos están en metros, la varianza está en metros cuadrados.

Un tercer error es confundir las fórmulas de población y de muestra. El denominador correcto depende de la situación: usa NN para una población completa y n1n-1 para una muestra.

También ayuda recordar que la varianza y la desviación estándar son sensibles a los valores atípicos porque las desviaciones grandes se elevan al cuadrado antes de promediarse.

Cuándo es útil cada medida

Usa el rango cuando quieras una primera mirada rápida de qué tan amplio es el recorrido de los datos.

Usa la varianza cuando necesites la medida de dispersión dentro de otros métodos estadísticos. Muchas fórmulas de probabilidad y estadística se construyen alrededor de la varianza, aunque después los informes muestren la desviación estándar en su lugar.

Usa la desviación estándar cuando quieras una descripción práctica de la dispersión en las mismas unidades que los datos. En muchos resúmenes escolares y del mundo real, es la opción más fácil de leer.

Prueba un problema similar

Crea dos conjuntos de datos cortos con la misma media y el mismo rango, y luego compara su varianza y su desviación estándar. Si quieres dar el siguiente paso, prueba tu propia versión en un solver después de resolverla a mano.

¿Necesitas ayuda con un problema?

Sube tu pregunta y obtén una solución verificada, paso a paso, en segundos.

Abrir GPAI Solver →