Visualización de datos: diagrama de dispersión (o gráfico de correlaciones)

Jairo Sarmiento
Visualización de datos: diagrama de dispersión (o gráfico de correlaciones)

En el mundo de la visualización de datos, hay gráficos que destacan por su sencillez y, al mismo tiempo, por su capacidad para revelar patrones complejos. El diagrama de dispersión es uno de ellos. A primera vista puede parecer un conjunto de puntos sin orden, pero cuando se lee con cuidado, permite identificar relaciones, tendencias y comportamientos que no son evidentes en una tabla.

¿Qué es un diagrama de dispersión?

 Un diagrama de dispersión es un tipo de gráfico que representa la relación entre dos variables numéricas, representando cada par de datos como un punto en un plano cartesiano (ejes X e Y) . Al observar cómo se distribuyen esos puntos, es posible detectar si existe algún tipo de relación entre ambas variables, ya sea positiva, negativa o inexistente.

Gráfico tomado del portal Fútbol con datos.

¿Para qué sirve?

 Este tipo de visualización se utiliza principalmente para explorar relaciones entre variables y formular hipótesis. Por ejemplo, puede ayudar a responder preguntas como si a mayor nivel de ingreso corresponde un mayor nivel educativo, o si existe alguna relación entre el número de horas trabajadas y la productividad. También es útil para identificar valores atípicos —puntos que se alejan del comportamiento general— y para evaluar si una relación parece lineal o si sigue otro tipo de patrón.

En periodismo de datos y análisis público, los diagramas de dispersión permiten contrastar discursos con evidencia. No prueban causalidad por sí mismos, pero sí ofrecen una base visual para discutir correlaciones y abrir nuevas líneas de análisis.

Recomendaciones

Para que un diagrama de dispersión sea claro y útil, es importante elegir bien las variables. Ambas deben ser numéricas y comparables. También conviene etiquetar claramente los ejes y, cuando sea necesario, incluir unidades de medida. Si el gráfico contiene muchos puntos, puede ser útil ajustar la transparencia para evitar la saturación visual. En algunos casos, añadir una línea de tendencia ayuda a guiar la lectura, pero siempre debe hacerse con cuidado y explicando qué representa.

Otro aspecto clave es el contexto. Un diagrama de dispersión aislado puede llevar a interpretaciones apresuradas, por lo que es fundamental acompañarlo de una explicación que aclare qué se está comparando y por qué.

Gráfico tomado de la página web de Datawrapper.

Visualizaciones relacionadas

 Existen otros gráficos que complementan o amplían el análisis que ofrece un diagrama de dispersión. Los gráficos de burbujas, por ejemplo, incorporan una tercera variable mediante el tamaño de los puntos. Los gráficos de densidad permiten entender mejor la concentración de observaciones cuando hay muchos datos. También es común combinar diagramas de dispersión con pequeños múltiplos para comparar patrones entre distintos grupos.

Ejemplos

Este gráfico realizado por Properati compara el alquiler promedio de una vivienda de clase media con el salario mínimo mensual en 17 ciudades de América Latina. Cada punto representa una ciudad: en el eje horizontal se ubica el costo promedio del alquiler en dólares y en el eje vertical cuántos salarios mínimos se necesitan para pagarlo. 

La lectura combinada de ambos ejes permite entender no sólo cuánto cuesta arrendar, sino qué tan accesible es ese costo para quienes reciben el salario mínimo en cada contexto urbano.

Crea tu cuenta en Datasketch y empieza a visualizar este y otros tipos de gráficos.

Dataviz

🚀 Oportunidad limitada: ¡Sé uno de nuestros 100 socios de datos que están definiendo el futuro de IA con datos verificados!

Únete a la Red