MEDIAS DE VARIABILIDAD

Son medidas que muestran la forma como se distribuyen (agrupan o dispersan) los datos alrededor de la media.

VARIANZA: compara qué tanto varían dos o más datos. Se obtiene utilizando la fórmula para población o muestra, así:

Varianza Poblacional

Varianza Muestral

De la varianza se deriva una variable llamada Desviación Estándar, un valor que determina la distancia promedio a la que están todos los datos respecto de la media muestral. La desviación se halla sacando la raíz cuadrada de la varianza, así como lo muestra el siguiente ejemplo:

Ahora, una vez se conozca el valor de la desviación de todos los datos, si se quiere analizar en especial la desviación de uno solo entonces se habla del Punto Z

**Al final de las explicaciones hay un ejemplo en el que se resume todo lo visto en esta unidad**

Diagrama de Caja y Bigotes

En él se ilustra las posiciones principales de un grupo de datos. Se ubican los respectivos valores que representan el 25%, el 50% (el mismo valor que tiene la Mediana) y el 75% del total de datos. Estos valores se obtienen sacando los cuartiles respectivos, de la manera como ya se explicó.

Rango Intercuartílico (IQR): es la resta del valor obtenido en el cuartil 3 menos el valor del cuartil 1
-> IQR =Q3-Q1

Bigotes: Es una extensión que tiene la caja hacia los lados, para mostrar hasta dónde pueden ubicarse los datos, fuera de ella, sin ser considerados como atípicos.
Los bigotes se hallan multiplicando el IQR por 1,5 y obteniendo los límites así:
Límite inferior= Q1 - (1,5*IQR)
Límite superior= Q3 + (1,5*IQR)

Ejemplo 1

Ejemplo 2


La posición de la mediana (a la derecha, en el centro o a la izquierda de la caja), indica hacia dónde tienden más los datos. Si está en el centro, quiere decir que la distribución es simétrica, si se ubica hacia la derecha o la izquierda, significa que los datos tienden a concentrarse en un punto de cualquiera de las dos partes.

Nota: cuando el conjunto de datos es muy disperso, el diagrama será ancho.


Campana de Gauss

Es un gráfico que determina los puntos máximos en donde se pueden ubicar los datos de una muestra dentro de un rango determinado por los extremos de la campana -máximo tres desviaciones a la izquierda y tres a la derecha de la media, donde se encuentra el punto más alto de la campana.-
La forma de obtener los puntos máximos es:

  • Obtener el valor de la media
  • Obtener el valor de la Desviación Estándar
  • Multiplicar la desviación por 3
  • Restar de la media el resultado de la multiplicación
  • Ubicar los puntos obtenidos en el plano
  • Hacer el gráfico de la campana

Cualquier punto que se encuentre por fuera del gráfico, se considera como atípico, es decir, se sale de lo normal, ya que ocurre un fenómeno especial que lo causa y es necesario detectarlo para corregirlo.

Teorema de Chebyshev

Muestra la cantidad de datos que se encuentran en un número n de desviaciones. Es decir, la cantidad de datos que están a una desviación de la media (hacia la derecha y hacia la izquierda), los que están a dos o a tres desviaciones de la media.

Para hallar esta cantidad, se usa la fórmula:

EJEMPLO


1.    El personal de un consultorio analiza los tiempos de espera de los pacientes que requieren servicio de emergencia. Los siguientes datos son los tiempos de espera en minutos recolectados a lo largo de un mes.

2          5          10       12       4          4          5          17       11       8          9          8          12
21       6          8          7          13       18       3

  1. Realice el análisis de variabilidad por datos agrupados.
  2. Dibuje la campana de Gauss e interprete los datos que en ella coloca.
  3. Realice el diagrama de caja (Box Spot) y compare los resultados contra la información obtenida en la campana de Gauss.
  4. Determine el análisis d puntos z para 11, 8, 12 y 15. Interprete su respuesta.
SOLUCIÓN
Análisis de Variabilidad
                                
                                        Media: 8,95
                                                     Varianza: 43,9123
                                                     Desviación Estándar: 6,6264


La variabilidad para datos agrupados muestra que en general los tiempos de espera en una emergencia se encuentran a una desviación de 6,62 (minutos en este caso) respecto de la media. O sea que el tiempo de espera de quien dura 2 minutos y quien dura 12 minutos es normal ya que se encuentran a una desviación normal de la media (8,95). Lo ideal para el consultorio es lograr que todos los pacientes que llegan de emergencia sean atendidos en un tiempo cercano al que refiere la media (no más de 8 minutos), lo que permitirá tener un mayor control en el flujo de pacientes que ingresan de emergencia.


Campana de Gauss

CAMPANA DE GAUSS
+
-
A 1 DESV. ESTA
5,34568198
14,295682
3,60431802
A 2 DESV. ESTA
10,691364
19,641364
-1,74136395
A 3 DESV. ESTA
16,0370459
24,9870459
-7,08704593


La campana muestra el espacio aceptable para que los datos obtenidos se ubiquen dentro del gráfico, o sea, un tiempo cualquiera de espera que presente un paciente es considerado normal, si se encuentra ubicado dentro de la campana. Si el tiempo supera los límites, es decir, si se halla por fuera de la campana, significa que es una anomalía: por ejemplo, si un paciente espera 45 minutos para ingresar a urgencias, este dato se verá reflejado fuera de lo que la campana declara normal, por tanto hay que analizar qué sucedió para que se diera tal anomalía y corregirla.


Diagrama de Caja

RESUMEN DE DATOS
DATO MENOR
2
Q1
4,5
Q2
8
Q3
12
DATO MAYOR
21



IQR
7,5
1,5 (IQR)
11,25
LIM INFERIOR
-6,75
LIM SUPERIOR
23,25




Comparación Campana de Gauss y Diagrama de Caja
Ambos gráficos muestran los márgenes en los que pueden ubicarse los datos del experimento -el tiempo en minutos que tarde un paciente que llegue de emergencia- sin tomarse como anormales, es decir, que se encuentran dentro del tiempo normal de espera para ser atendidos. Sin embargo, detallando cada gráfico se ve que la campana da un rango un poco más amplio para que los datos no se vean como anormalidades. Este rango se refleja en los extremos que tiene la campana (-7,08 y 24,98) y para el Box Spot en los puntos máximos a donde llegan los bigotes de la caja (-6,75 y 23,25).

Análisis de Punto Z

PUNTO Z
11
0,309357344
8
-0,14336072
12
0,460263365
15
0,91298143


Los cuatro puntos elegidos presentan entre 0,1 y 0,9 desviaciones respecto de la media, lo que significa que todos están muy cerca del tiempo medio de espera ideal para los pacientes que llegan al consultorio en estado de emergencia



No hay comentarios:

Publicar un comentario