La varianza mide qué tan dispersos están los números alrededor de su media. Una varianza pequeña significa que los valores se mantienen bastante cerca de la media. Una varianza grande significa que están más dispersos.

Para calcular la varianza, encuentra qué tan lejos está cada valor de la media, eleva al cuadrado esas distancias y calcula su promedio. Elevar al cuadrado es importante porque, de lo contrario, las desviaciones positivas y negativas se cancelarían entre sí.

Fórmula de la varianza: población vs. muestra

Usa la fórmula de la varianza poblacional cuando tus datos incluyen todos los valores del grupo que quieres describir:

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

Usa la fórmula de la varianza muestral cuando tus datos son solo una muestra y quieres estimar la dispersión de una población más grande:

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

La única diferencia está en el denominador. Usa NN para una población completa. Usa n1n-1 para una estimación basada en una muestra.

Qué significa la varianza

La varianza no te dice dónde está el centro. Te dice qué tan lejos suelen estar los datos de ese centro.

Si dos conjuntos de datos tienen la misma media, el que tiene mayor varianza tiene valores que, en promedio, están más lejos de la media. Como las desviaciones se elevan al cuadrado, las diferencias inusualmente grandes tienen más influencia.

Un detalle importante: la varianza se mide en unidades cuadradas. Si los datos están en metros, la varianza está en metros cuadrados. Por eso, la desviación estándar suele ser más fácil de interpretar en el uso cotidiano.

Cómo calcular la varianza: ejemplo resuelto

Usa el conjunto de datos 2,4,4,4,5,5,7,92, 4, 4, 4, 5, 5, 7, 9.

Primero encuentra la media:

xˉ=2+4+4+4+5+5+7+98=408=5\bar{x} = \frac{2+4+4+4+5+5+7+9}{8} = \frac{40}{8} = 5

Ahora resta la media a cada valor y eleva al cuadrado el resultado:

  • (25)2=9(2-5)^2 = 9
  • (45)2=1(4-5)^2 = 1
  • (45)2=1(4-5)^2 = 1
  • (45)2=1(4-5)^2 = 1
  • (55)2=0(5-5)^2 = 0
  • (55)2=0(5-5)^2 = 0
  • (75)2=4(7-5)^2 = 4
  • (95)2=16(9-5)^2 = 16

Suma esas desviaciones al cuadrado:

9+1+1+1+0+0+4+16=329+1+1+1+0+0+4+16 = 32

Si estos ocho valores son toda la población, la varianza poblacional es:

σ2=328=4\sigma^2 = \frac{32}{8} = 4

Si esos mismos ocho valores se tratan como una muestra de una población más grande, la varianza muestral es:

s2=3274.57s^2 = \frac{32}{7} \approx 4.57

Este ejemplo muestra claramente la idea principal: las desviaciones al cuadrado son las mismas, pero la respuesta final cambia según dividas entre NN o entre n1n-1.

Errores comunes al calcular la varianza

  • Olvidar elevar al cuadrado las desviaciones. Si promedias desviaciones sin elevarlas al cuadrado, los valores positivos y negativos se cancelan, así que ya no mides correctamente la dispersión.
  • Confundir la varianza poblacional con la muestral. Divide entre NN para una población completa y entre n1n-1 para una muestra que estima una población mayor.
  • Olvidar que la varianza usa unidades cuadradas. La varianza es útil, pero la desviación estándar suele ser más fácil de leer porque vuelve a las unidades originales.
  • Suponer que una varianza grande siempre es mala. Una varianza mayor solo significa más dispersión. Que eso importe o no depende del contexto.

Cuándo se usa la varianza

La varianza se usa siempre que necesites describir o comparar la dispersión de manera consistente.

  • En estadística, ayuda a resumir qué tan disperso está un conjunto de datos.
  • En control de calidad, puede ayudar a seguir si un proceso se mantiene consistente con el tiempo.
  • En finanzas, la varianza se usa para describir cuánto fluctúan los rendimientos, aunque es solo una forma de pensar sobre el riesgo.
  • En aprendizaje automático y análisis de datos, ayuda a describir cómo varían las características o los errores entre observaciones.

Prueba un problema similar

Intenta tu propia versión con dos conjuntos de datos pequeños que tengan la misma media pero distinta dispersión. Calcula la varianza de ambos y observa si el conjunto más disperso obtiene el valor mayor. Esa sola comparación suele hacer que la idea quede clara.

¿Necesitas ayuda con un problema?

Sube tu pregunta y obtén una solución verificada, paso a paso, en segundos.

Abrir GPAI Solver →