Cómo se puede aprender utilizando el diagrama de cuadro para estudiar problemas de centrado y variación o ambos

Una de las herramientas de visualización de datos más importantes que se utiliza en el análisis es Box Plot. Se usa para estudiar la variación que está presente en el proceso. Con Advance Innovation Group uno puede aprender usando Box Plot para estudiar problemas de centrado y variación, o ambos. Podemos estudiar el centrado del proceso porque el diagrama de caja, traza la mediana como la medida de la tendencia central y podemos estudiar la variación sabia cuartil. Entonces, el diagrama de caja lo ayuda a comprender la variación que está presente en su proceso en cada trimestre y luego puede identificar cuál es el área que le interesa. ¿Hay algún problema en Q1, Q2 o Q3?

Además, Advance Innovation Group también lo ayudará a comprender el uso de Boxplot para comparar diferentes subgrupos. Puede comparar el diagrama de cajas entre el macho y la hembra, puede comparar el diagrama de cajas entre el Líder del equipo A / B o puede comparar el diagrama de cajas del rendimiento del producto A y el Producto B. Hay parejas de componentes de Box Plot.

Mediana: mediana también se llama cuartil 2 (Q2). Esto divide mi proceso completo en dos partes iguales, lo que significa que el 50% de los puntos de datos caerán por encima y por debajo de esta línea.

Cuartil 1: Q1 divide la línea debajo de la mediana en dos partes iguales. Eso significa que el 25% de los datos estarán por debajo de Q1 y el 75% de los puntos de datos se encontrarán por encima de Q1.

Cuartil 3: Q3 divide la línea superior a la mediana en dos partes iguales. Eso significa que el 25% de los datos se encontrarán por encima de Q3 y el 75% de los puntos de datos se encontrarán por debajo de Q3.

Rango Intercuartil: el rango de IQ comienza desde Q1 y termina hasta Q3. Eso significa que el 25% de los puntos de datos caerá por debajo del rango de IQ y el 25% de los puntos de datos caerá por encima del rango de IQ. Así que el rango de IQ es el 50% del punto o proceso de datos.

Entonces, el diagrama de caja lo ayuda a comprender si su proceso es simétrico o no. Si la mediana no está exactamente en el medio del rango de IQ, entonces la variación será mayor en Q1 que en Q3 o viceversa. Generalmente sucede cuando tus datos no son normales. Si los datos son normales, la variación en Q1, Q2 y Q3 y Q4 será casi igual, no exactamente igual pero casi igual. Así que la gráfica de caja le da una idea acerca de cada cuartil, media, rango de CI y línea recta superior llamada "Bigote" (que es mínimo y hasta Máximo de puntos de datos dibujados) y Estrella (*) se llama valores atípicos del proceso. Estos "valores atípicos" vienen en el proceso cuando existe una variación de causa especial. Cualquier punto de datos que esté por encima de Q3 + 1.5 veces el rango de IQ o por debajo de Q1-1.5 veces de IQ Range se denomina outliers. Tan significativo es que entiendan si hay algún valor extremo en su conjunto de datos o no. Cada vez que se presente un valor extremo en su conjunto de datos se anotará como "Atípico" en el diagrama de caja.

En Advance Innovation Group, también aprenderá las siguientes 4 opciones en Boxplot-

1.Una Y, simple: usamos una opción Y simple, cuando queremos dibujar un cuadro de un subgrupo o decir un proceso o podemos decir cuando tenemos solo una Y. Por ejemplo, quiero dibujar un diagrama de caja de " Ventas en Delhi "o" Ventas en Mumbai "o" Ventas en Noida ", por lo que en la columna" Variables de grupo "seleccione datos de su interés como" Ventas de Delhi "y puede ir a" Escala "en la pestaña" Línea de referencia "que pueda pon tu objetivo como 10,000 y luego haz clic en OK.

2.Una Y, con un grupo: elegimos esta opción. Si deseo marcar "Ventas en Delhi" y en "Ventas en Delhi", quiero verificar las ventas de hombres y mujeres. Entonces en Delhi tengo 2 subgrupos. Luego, en la opción "Variables de gráfico", seleccione "Ventas en Delhi" y en la columna "Variables categóricas para agrupar 0-4, Primero más externo", seleccione Mayús o Sexo, luego vaya a "Escala" y en la pestaña "Línea de referencia" puede configurar el objetivo y puede comparar. Pero el tamaño de la muestra debe ser equilibrado como (hombres = 50, mujeres = 50).

3. Y's múltiples, Simple: Elegimos esta opción cuando tenemos múltiples Y con un subgrupo. Utilizamos Multiple Y's, opción simple cuando tenemos más de una Y. Digamos que nuestra empresa tiene dos sucursales en Delhi y Mumbai y quiero comparar el rendimiento de Delhi y Mumbai. Por lo tanto, en la columna "Variables del gráfico", seleccione "Ventas de Delhi y Mumbai", luego vaya a "Escala" y en la pestaña "Línea de referencia" asigne el objetivo (10.000).

Múltiples Y, con grupos: utilizamos esta opción cuando tenemos más de un problema (Y) con más de un subgrupo. Si quiero comparar Delhi, Mumbai y Noida Sales en base a Género, Educación (más de uno), para eso en la opción "Variables de gráfico" seleccionamos "Ventas en Delhi / Mumbai / Noida" y en "Variables categóricas" para agrupar (1-3 más al exterior primero) "columna poner género / educación y finalmente ir a" Escala "y en" Línea de referencia "Asignar objetivo de la pestaña (10,000).