Un diagrama de dispersión muestra la relación entre dos variables numéricas. Cada punto es un par de valores, así que puedes ver rápidamente si los datos suben, bajan, se dispersan, se agrupan o contienen puntos inusuales.

Eso convierte al diagrama de dispersión en la forma más rápida de responder a la pregunta que la mayoría de los estudiantes realmente tiene: "¿Qué está pasando en estos datos?" Antes de calcular la correlación o trazar una recta de mejor ajuste, el gráfico te dice si esos resúmenes siquiera tienen sentido.

Cómo leer un diagrama de dispersión

El eje horizontal muestra una variable y el eje vertical muestra la otra. Si un estudiante estudió 44 horas y sacó 7878, el punto es (4,78)(4,78).

Una vez que los puntos están en el gráfico, busca el patrón general:

  • Correlación positiva: los puntos tienden a subir de izquierda a derecha.
  • Correlación negativa: los puntos tienden a bajar de izquierda a derecha.
  • Poca o ninguna correlación clara: los puntos no muestran una tendencia lineal fuerte.

También revisa si hay agrupaciones, huecos y valores atípicos. Los datos reales casi nunca caen exactamente sobre una sola recta, así que el objetivo es ver la tendencia, no una alineación perfecta.

Qué significa la correlación en un diagrama de dispersión

La correlación describe la dirección y la fuerza de una relación lineal. "Lineal" es la condición clave: la correlación resume qué tan bien los puntos siguen una tendencia en línea recta.

Si los puntos se agrupan alrededor de una recta ascendente, la correlación es positiva. Si se agrupan alrededor de una recta descendente, la correlación es negativa. Si los puntos aparecen dispersos sin una dirección clara en línea recta, la correlación lineal es débil o cercana a cero.

Un patrón curvo también puede mostrar una relación real. Simplemente puede que no tenga una correlación lineal fuerte.

Cuándo ayuda una recta de mejor ajuste

Una recta de mejor ajuste es una línea recta trazada para representar la tendencia general de los puntos. No necesita pasar por todos los puntos. Su función es mantenerse cerca de la nube de puntos en conjunto.

Usa una recta de mejor ajuste solo cuando el diagrama de dispersión sea aproximadamente lineal. En ese caso, la recta ayuda en dos cosas:

  • resumir la tendencia
  • hacer predicciones aproximadas dentro del rango observado

Si el patrón es curvo, está dividido en grupos o está dominado por valores atípicos, una recta de mejor ajuste puede ocultar más de lo que explica.

Ejemplo de diagrama de dispersión: horas de estudio y notas de un cuestionario

Supón que un profesor registra el tiempo de estudio y la nota de un cuestionario de cinco estudiantes:

(1,55), (2,61), (3,68), (4,74), (5,81)(1,55),\ (2,61),\ (3,68),\ (4,74),\ (5,81)

Estos puntos suben de izquierda a derecha y se mantienen bastante cerca de una línea recta. Eso significa que la relación es positiva y aproximadamente lineal.

Así que tanto la correlación como una recta de mejor ajuste son resúmenes razonables aquí. Esperarías que la recta de mejor ajuste tuviera pendiente positiva porque tiempos de estudio mayores tienden a ir junto con notas mayores.

Ahora añade un punto extra en (5,40)(5,40). La tendencia puede seguir siendo positiva, pero este punto es un valor atípico y podría arrastrar la recta de mejor ajuste hacia abajo. Por eso el gráfico debe ir antes que el resumen: la imagen te dice si el resumen es fiable.

Errores comunes con los diagramas de dispersión

Confundir correlación con causalidad

Si dos variables se mueven juntas, eso no significa automáticamente que una cause la otra. Un tercer factor puede afectar a ambas, o el patrón puede ser más complicado de lo que parece al principio.

Forzar una recta sobre un patrón curvo

Algunos datos siguen una curva en lugar de una línea recta. En ese caso, una recta de mejor ajuste lineal puede dar un resumen engañoso.

Ignorar los valores atípicos

Un solo punto inusual puede cambiar mucho la tendencia aparente. Los valores atípicos no siempre significan que los datos estén mal, pero nunca deben ignorarse sin revisar el contexto.

Olvidar qué representa un punto

Un diagrama de dispersión solo funciona con datos emparejados. Cada punto debe provenir de una observación que tenga tanto un valor de xx como un valor de yy.

Cuándo se usan los diagramas de dispersión

Los diagramas de dispersión se usan en estadística, ciencia, negocios e investigación social siempre que quieras comparar dos variables numéricas. Algunos ejemplos comunes son altura y peso, gasto en publicidad y ventas, o tiempo de estudio y nota de un examen.

Son especialmente útiles al comienzo de un análisis porque pueden revelar patrones que una sola fórmula puede ocultar, como agrupaciones, huecos o valores atípicos.

Prueba un problema similar

Toma un pequeño conjunto de datos emparejados y dibuja los puntos antes de calcular la correlación. Hazte tres preguntas: ¿el patrón sube o baja?, ¿parece aproximadamente lineal? y ¿hay puntos inusualmente alejados del resto?

Si el patrón parece aproximadamente lineal, explora los mismos datos con un coeficiente de correlación o una recta de mejor ajuste simple. Ese es el siguiente paso natural: pasar de la imagen al resumen.

¿Necesitas ayuda con un problema?

Sube tu pregunta y obtén una solución verificada, paso a paso, en segundos.

Abrir GPAI Solver →