DIAGRAMA DE CAJA Y BIGOTE
Un Diagrama
de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de
datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los
"bigotes".
Es un gráfico que suministra información sobre los
valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de
la distribución. Primero es necesario encontrar la mediana para luego encontrar
los 2 cuartiles restantes
·
CÓMO
EXPRESARLO GRAFICAMENTE
+-----+-+
* o
|-----------| | |---|
+-----+-+
+---+---+---+---+---+---+---+---+---+---+---+---+
0
5 10 12
·
Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles
Q1, Q2 y Q3 y el Rango Inter Cuartilico (RIC):
En el ejemplo, para trazar la caja:
·
Valor 7: es el Q1 (25% de los datos)
·
Valor 8.5: es el Q2 o mediana (el 50% de los datos)
·
Valor 9: es el Q3 (75% de los datos)
·
Rango Inter Cuartilico RIC (Q3-Q1)
·
Los bigotes, las líneas que se
extienden desde la caja, se extienden hasta los valores máximo y mínimo de la serie
o hasta 1.5 veces el RIC.
Cuando los datos se extienden más
allá de esto, significa que hay valores atípicos en la serie y entonces hay que
calcular los límites superior e inferior, Li y Ls.
Para ello, se consideran atípicos los
valores son aquellos inferiores a Q1-1.5*RIC o superiores a Q3+1.5*RIC.
En el ejemplo:
·
inferior: 7-1.5*2=4
·
superior: 9+1.5*2=12
Ahora se buscan los últimos valores
que NO son atípicos, que serán los extremos de los bigotes.
·
En el ejemplo: 4 y 10
·
Marcar como atípicos todos los datos
que están fuera del intervalo (Li, Ls).
En el ejemplo: 0.5 y 2.5
·
Además, se pueden considerar valores
extremadamente atípicos aquellos que exceden Q1-3*RIC o Q3+3*RIC.
De modo que, en el ejemplo:
·
inferior: 7-3*2=1
·
superior: 9+3*2=15
·
UTILIDAD
·
Proporcionan una visión general de la
simetría de la distribución de los datos; si la mediana no está en el centro
del rectángulo, la distribución no es simétrica.
·
Pertenece a las herramientas de la
estadística descriptiva. Permite ver como es la dispersión de los puntos con la
mediana, los percentiles 25 y 75 y los valores máximos y mínimos.
muchas gracias me sirvió mucho tu explicación :3 (y)
ResponderEliminar