DIAGRAMA DE DISPERSIÓN

Si se quiere comparar el grado de relación entre dos variables (X, Y) las cuales una depende de la otra, se debe realizar un diagrama en el que se vea la dispersión de los datos en un plano cartesiano.

Con base en el siguiente ejemplo se planteará una situación que servirá de explicación para este tema:


A continuación se presentan las calificaciones obtenidas por hoteles de una, dos, tres, cuatro y cinco estrellas (Xi), que fueron dadas por parejas que pasaron su luna de miel en cada uno de ellos (Yi). El criterio de evaluación fu el servicio prestado y la cordialidad con que se les trató.
  1. Realizar el análisis de dispersión e intepretar sus resultados.
  2. Si una pareja da una calificación de 40 al hotel en el que se hospedó, ¿de qué categoría se puede suponer es el hotel?
>>Para poder realizar un análisis correcto, se necesitan conocer distintos datos, entre ellos:
  • Media de cada una de las variables.
  • Desviación estándar de los datos de cada variable
  • Varianza de la variable X
  • Covarianza entre ambas variables
  • Coeficiente de Correlación entre las dos variables
  • Recta de Regresión


Conceptos nuevos:
 **Covarianza: asociación lineal entre dos variables (X-Y)**

        Se halla por medio de la siguiente fórmula:


  • Se resta a todos los valores X el valor de la media
  • Se resta a todos los valores Y el valor de la media
  • Se multiplican los resultados obtenidos en los primeros puntos
  • Se realiza la sumatoria de estas multiplicaciones
  • El resultado obtenido se divide entre la cantidad de datos menos uno
**Coeficiente de Correlación: valor que indica qué tan directa y cercana es la relación entre                  dos variables (X-Y)** 

         Se halla utilizando la siguiente fórmula:
  • Se divide el valor de la covarianza entre el resultado de la multiplicación de las desviaciones estándar de las variables.
  • El resultado obtenido debe ser mayor que -1 y menor que 1
**Recta de regresión: se basa en la típica ecuación Y = mx+b, busca encontrar los valores adecuados y plantear la ecuación debida. Se obtiene así:
  • Se divide la Covarianza entre la Varianza de X
  • El valor obtenido en el punto anterior se multiplica por X (sin reemplazar X por ningún valor) y por el valor de la media de X
  • Se suman o restan los valores de la misma naturaleza (los que no contengan X)  


Solución

Diagrama de Dispersión


El coeficiente de correlación es un valor positivo cercano a 1, lo que significa que la relación entre las variables es casi directamente proporcional, ya que al aumentar el número de estrellas del hotel, aumenta la calificación dada por las parejas en la mayoría de casos. Por ejemplo, la mayor calificación obtenida fue de 44 puntos sobre 50, y corresponde efectivamente al Hotel 5 estrellas.
El diagrama refleja efectivamente lo que muestran los datos, pues la línea recta blanca simula una correlación perfecta y los puntos están muy cercanos a formar una línea similar, por tanto se comprueba el análisis de correlación.

Para resolver la segunda pregunta se debe resolver la ecuación de la Recta de Regresión así:


Una vez obtenida la recta, se reemplazan los valores para hallar la respuesta deseada.

Se pide encontrar la categoría del hotel al que correspondió la calificación de 40, que una pareja otorgó; teniendo en cuenta que la variable Y se refiere a las calificaciones, entonces la variable que se debe hallar en la ecuación es X. Realizando todo el proceso y despejando, se observa que el hotel es de 4 estrellas.

No hay comentarios:

Publicar un comentario