jueves, 4 de junio de 2015

DIAGRAMA DE CAJA Y BIGOTE


DIAGRAMA DE CAJA Y BIGOTE
Un Diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".
Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución. Primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles restantes


·         CÓMO EXPRESARLO GRAFICAMENTE

                            +-----+-+   
  *       o     |-----------|     | |---|
                            +-----+-+   
                                        
+---+---+---+---+---+---+---+---+---+---+---+---+
0                   5                   10      12


·         Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el Rango Inter Cuartilico (RIC):
En el ejemplo, para trazar la caja:
·         Valor 7: es el Q1 (25% de los datos)
·         Valor 8.5: es el Q2 o mediana (el 50% de los datos)
·         Valor 9: es el Q3 (75% de los datos)
·         Rango Inter Cuartilico RIC (Q3-Q1)


·        Los bigotes, las líneas que se extienden desde la caja, se extienden hasta los valores máximo y mínimo de la serie o hasta 1.5 veces el RIC.
Cuando los datos se extienden más allá de esto, significa que hay valores atípicos en la serie y entonces hay que calcular los límites superior e inferior, Li y Ls.
Para ello, se consideran atípicos los valores son aquellos inferiores a Q1-1.5*RIC o superiores a Q3+1.5*RIC.
En el ejemplo:
·         inferior: 7-1.5*2=4
·         superior: 9+1.5*2=12
Ahora se buscan los últimos valores que NO son atípicos, que serán los extremos de los bigotes.
·         En el ejemplo: 4 y 10
·         Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).
En el ejemplo: 0.5 y 2.5
·         Además, se pueden considerar valores extremadamente atípicos aquellos que exceden Q1-3*RIC o Q3+3*RIC.
De modo que, en el ejemplo:
·         inferior: 7-3*2=1
·         superior: 9+3*2=15

·        UTILIDAD
·         Proporcionan una visión general de la simetría de la distribución de los datos; si la mediana no está en el centro del rectángulo, la distribución no es simétrica.
·         Son útiles para ver la presencia de valores atípicos.
·         Pertenece a las herramientas de la estadística descriptiva. Permite ver como es la dispersión de los puntos con la mediana, los percentiles 25 y 75 y los valores máximos y mínimos.