El diagrama de dispersión permite analizar si existe algún tipo de relación entre dos variables. Por ejemplo, puede ocurrir que dos variables estén relacionadas de manera que al aumentar el valor de una, se incremente el de la otra. En este caso hablaríamos de la existencia de una correlación positiva.

También puede ocurrir que al producirse una en un sentido, la otra derive en el sentido contrario; por ejemplo, al aumentar el valor de la variable x, se reduzca el de la variable y. Entonces, se estaría ante una correlación negativa. Si los valores de ambas variable se revelan independientes entre sí, se afirmaría que no existe correlación.

Ventajas

  • Representa la relación entre dos variables de forma gráfica, lo que hace más fácil visualizar e interpretar los datos.
  • Calculando la correlación de dos variables, permite cuantificar el grado de relación entre ambas, asó como su signo.

Utilidades

  • Obtener información para determinar si dos variables están relacionadas.
  • Comprobar cómo afecta a una variable los cambios producidos en otra.
  • Probar las posibles relaciones causa / efecto.

El Objeto del Diagrama de Dispersión

El diagrama de dispersión es una herramienta que ayuda a identificar la posible relación entre dos variables. Representa la relación entre dos variables de forma gráfica, lo que hace más fácil visualizar e interpretar los datos.

Permite analizar las relaciones entre dos variables mediante su representación en un gráfico cartesiano, donde una variable se caracteriza en el eje horizontal y la otra en el eje vertical. El patrón de los puntos de intersección gráfica puede mostrar esquemas de relación entre ambas variables.

dispersión

Esta correlación puede señalar, pero no por ello probar, una relación causal, es decir, no predice relaciones causa – efecto, sino que muestra la intensidad de la relación entre dos variables. Por lo tanto, es importante no apresurarse a obtener conclusiones sobre la relación entre las variables, ya que puede ser otra tercera que afecte a la relación.

Desarrollo del Diagrama de Dispersión

Si bien el diagrama de dispersión es fácil de usar, debe ser interpretado con prudencia. Para construir un diagrama de dispersión, los pasos a seguir son:

1. Reunir los Datos

Seleccionadas las variables a estudiar, se reúne un mínimo de 50 parejas de datos de las dos variables sobre las que se desea comprobar su posible relación.

En el caso que servirá de ejemplo al desarrollo de esta herramienta, las variables a analizar son las puntuaciones medias obtenidas para los distintos  factores del servicio, tanto en percepción (X) como en expectativas (Y), a partir de una muestra de usuarios de un servicio administrativo a los que se les administró una encuesta de satisfacción.

tabla de datos - coeficiente de dispersión

2. Dibujar el Diagrama

Se prepara el diagrama trazando los ejes vertical y horizontal de modo que tengan similar longitud. Así mismo, se etiquetan el diagrama y los ejes,  indicando en éstos los valores de las escalas de medida, que suelen ser en ambos casos ascendentes.

diagrama-percepción-expectativas

3. Representar los Datos

Se representan en el diagrama los pares de datos como puntos del diagrama de dispersión (figura 9.3). Se recomienda que los puntos que coincidan entre sí, al tener las mismas coordenadas, se rodeen tantas veces como se presente la repetición. No obstante hay que puntualizar que el procedimiento descrito puede ser llevado a cabo mediante una hoja de cálculo o cualquier aplicación estadística, lo que simplifica considerablemente el procedimiento.

Ejemplo de Diagrama de Dispersión

4. Interpretar el Diagrama

El resultado de un diagrama de dispersión puede ser de diversos tipos. Si los puntos trazados en el diagrama están dispersos al azar, sin un patrón discernible, significa que los dos conjuntos de mediciones no tienen relación entre sí. Si los puntos forman algún patrón, se denota la existencia de  relación entre los dos grupos de mediciones.

Generalmente, el diagrama mostrará los siguientes tipos posibles de relación:

Interpretación del Diagrama de Dispersión
Interpretación del Diagrama de Dispersión

En nuestro caso, parece existir una relación positiva entre las dos variables, es decir, las puntuaciones medias de percepción de calidad se incrementan a medida que aumentan las puntuaciones media de expectativas. No obstante, esta relación entre ambas variables parece ser débil, al tiempo que se observa una considerable dispersión de los datos, especialmente en el rango de valores altos para expectativas.

Coeficiente de Correlación

Para determinar con más precisión el grado de esa relación, se puede calcular el coeficiente de correlación lineal, que expresa la intensidad de la correlación entre dos variables. Este coeficiente puede calcularse mediante la fórmula correspondiente, si bien actualmente existen aplicaciones informáticas que permiten realizar esta tarea fácilmente mediante la introducción de las series de valores.

El coeficiente de correlación lineal, que se expresa mediante la letra “r”, es el cociente entre la covarianza y el producto de las desviaciones típicas de ambas variables[1]:

El valor de este coeficiente puede estar comprendido entre −1 y 1. Cuando toma un valor próximo a −1, la correlación es fuerte y negativa. Si el valor es cercano a +1, la correlación es fuerte y positiva. Si el coeficiente de correlación lineal presenta un valor próximo a 0, la correlación es débil.

Un coeficiente de 0 indicaría independencia total entre ambas variables. A su vez, un coeficiente de correlación lineal de 1 ó de -1 señalaría que entre ambas variables hay dependencia funcional, positiva o negativa según el signo del coeficiente.

El cálculo del coeficiente de correlación lineal  lineal efectuado para los datos del ejemplo de nuestro diagrama de dispersión arroja un resultado de:

r = 0,45

Se confirma que existe una relación positiva entre ambas variables, si bien la correlación encontrada es moderada.


Nota:

[1] Se utiliza el coeficiente de correlación de Pearson, aplicable para variables cuantitativas, que mide el grado de covariación entre distintas variables relacionadas linealmente. Esto significa que puede haber variables fuertemente relacionadas, pero no linealmente, en cuyo caso no es aplicable la correlación de Pearson.

Pin It on Pinterest

Share This