Son medidas que muestran la forma como se distribuyen (agrupan o dispersan) los datos alrededor de la media.
VARIANZA: compara qué tanto varían dos o más datos. Se obtiene utilizando la fórmula para población o muestra, así:
Varianza Poblacional
Varianza Muestral
De la varianza se deriva una variable llamada Desviación Estándar, un valor que determina la distancia promedio a la que están todos los datos respecto de la media muestral. La desviación se halla sacando la raíz cuadrada de la varianza, así como lo muestra el siguiente ejemplo:
Ahora, una vez se conozca el valor de la desviación de todos los datos, si se quiere analizar en especial la desviación de uno solo entonces se habla del Punto Z
**Al final de las explicaciones hay un ejemplo en el que se resume todo lo visto en esta unidad**
Diagrama de Caja y Bigotes
En él se ilustra las posiciones principales de un grupo de datos. Se ubican los respectivos valores que representan el 25%, el 50% (el mismo valor que tiene la Mediana) y el 75% del total de datos. Estos valores se obtienen sacando los cuartiles respectivos, de la manera como ya se explicó.
Rango Intercuartílico (IQR): es la resta del valor obtenido en el cuartil 3 menos el valor del cuartil 1
-> IQR =Q3-Q1
Bigotes: Es una extensión que tiene la caja hacia los lados, para mostrar hasta dónde pueden ubicarse los datos, fuera de ella, sin ser considerados como atípicos.
Los bigotes se hallan multiplicando el IQR por 1,5 y obteniendo los límites así:
Límite inferior= Q1 - (1,5*IQR)
Límite superior= Q3 + (1,5*IQR)
Ejemplo 1
Ejemplo 2
La posición de la mediana (a la derecha, en el centro o a la izquierda de la caja), indica hacia dónde tienden más los datos. Si está en el centro, quiere decir que la distribución es simétrica, si se ubica hacia la derecha o la izquierda, significa que los datos tienden a concentrarse en un punto de cualquiera de las dos partes.
Nota: cuando el conjunto de datos es muy disperso, el diagrama será ancho.
Campana de Gauss
Es un gráfico que determina los puntos máximos en donde se pueden ubicar los datos de una muestra dentro de un rango determinado por los extremos de la campana -máximo tres desviaciones a la izquierda y tres a la derecha de la media, donde se encuentra el punto más alto de la campana.-
La forma de obtener los puntos máximos es:
- Obtener el valor de la media
- Obtener el valor de la Desviación Estándar
- Multiplicar la desviación por 3
- Restar de la media el resultado de la multiplicación
- Ubicar los puntos obtenidos en el plano
- Hacer el gráfico de la campana
Cualquier punto que se encuentre por fuera del gráfico, se considera como atípico, es decir, se sale de lo normal, ya que ocurre un fenómeno especial que lo causa y es necesario detectarlo para corregirlo.
Teorema de Chebyshev
Muestra la cantidad de datos que se encuentran en un número n de desviaciones. Es decir, la cantidad de datos que están a una desviación de la media (hacia la derecha y hacia la izquierda), los que están a dos o a tres desviaciones de la media.
Para hallar esta cantidad, se usa la fórmula:
EJEMPLO
1. El personal de un consultorio analiza los tiempos de
espera de los pacientes que requieren servicio de emergencia. Los siguientes
datos son los tiempos de espera en minutos recolectados a lo largo de un mes.
2 5 10 12 4 4 5 17 11 8 9 8 12
21 6 8 7 13 18 3
- Realice el análisis de variabilidad por datos agrupados.
- Dibuje la campana de Gauss e
interprete los datos que en ella coloca.
- Realice el diagrama de caja
(Box Spot) y compare los resultados contra la información obtenida en la
campana de Gauss.
- Determine el análisis d
puntos z para 11, 8, 12 y 15. Interprete su respuesta.
SOLUCIÓN
Análisis de Variabilidad
Media: 8,95
Varianza: 43,9123
Desviación Estándar: 6,6264
La variabilidad para datos agrupados muestra que en
general los tiempos de espera en una emergencia se encuentran a una desviación
de 6,62 (minutos en este caso) respecto de la media. O sea que el tiempo de espera de quien dura 2 minutos y quien dura 12 minutos es normal ya que se encuentran a una desviación normal de la media (8,95). Lo ideal para el consultorio es lograr que
todos los pacientes que llegan de emergencia sean atendidos en un tiempo
cercano al que refiere la media (no más de 8 minutos), lo que permitirá tener
un mayor control en el flujo de pacientes que ingresan de emergencia.
Campana de Gauss
CAMPANA DE GAUSS
|
|||
+
|
-
|
||
A 1 DESV. ESTA
|
5,34568198
|
14,295682
|
3,60431802
|
A 2 DESV. ESTA
|
10,691364
|
19,641364
|
-1,74136395
|
A 3 DESV. ESTA
|
16,0370459
|
24,9870459
|
-7,08704593
|
La
campana muestra el espacio aceptable para que los datos obtenidos se ubiquen
dentro del gráfico, o sea, un tiempo cualquiera de espera que presente un
paciente es considerado normal, si se encuentra ubicado dentro de la campana.
Si el tiempo supera los límites, es decir, si se halla por fuera de la campana,
significa que es una anomalía: por ejemplo, si un paciente espera 45 minutos
para ingresar a urgencias, este dato se verá reflejado fuera de lo que la
campana declara normal, por tanto hay que analizar qué sucedió para que se
diera tal anomalía y corregirla.
Diagrama de Caja
RESUMEN
DE DATOS
|
|
DATO MENOR
|
2
|
Q1
|
4,5
|
Q2
|
8
|
Q3
|
12
|
DATO MAYOR
|
21
|
IQR
|
7,5
|
1,5 (IQR)
|
11,25
|
LIM INFERIOR
|
-6,75
|
LIM SUPERIOR
|
23,25
|
Comparación Campana de Gauss
y Diagrama de Caja
Ambos
gráficos muestran los márgenes en los que pueden ubicarse los datos del
experimento -el tiempo en minutos que tarde un paciente que llegue de
emergencia- sin tomarse como anormales, es decir, que se encuentran dentro del
tiempo normal de espera para ser atendidos. Sin embargo, detallando cada
gráfico se ve que la campana da un rango un poco más amplio para que los datos
no se vean como anormalidades. Este rango se refleja en los extremos que tiene
la campana (-7,08 y 24,98) y para el Box Spot en los puntos máximos a donde
llegan los bigotes de la caja (-6,75 y 23,25).
Análisis de Punto Z
PUNTO Z
|
|
11
|
0,309357344
|
8
|
-0,14336072
|
12
|
0,460263365
|
15
|
0,91298143
|
Los cuatro puntos elegidos presentan entre 0,1 y
0,9 desviaciones respecto de la media, lo que significa que todos están muy
cerca del tiempo medio de espera ideal para los pacientes que llegan al
consultorio en estado de emergencia
No hay comentarios:
Publicar un comentario