portada graficos para rrhh.png

Gráficos 

para RRHH

Cuáles son algunos de los tipos de gráfico que existen y cuál es el más indicado para presentar mi data

10 SEMANAS DE gráficoS aplicadoS para RRHH

A raíz de que hemos implementado Dashboards y Paneles en RRHH, consideramos que la visualización de datos, es igual de importante que el análisis en sí mismo. Hemos seleccionado 10 gráficos que esperamos te sirva para aplicarlo a tus reportes y facilitar la interpretación de tu audiencia.

Semana 1: Histograma

 

Tal vez es uno de los gráficos más clásicos representados por barras. Cada barra representa el número de veces (frecuencia) que se observan datos en un rango determinado. Un histograma solo toma como entrada una variable numérica.

 

La variable se divide en varios grupos con la misma amplitud (no se recomienda usar diferentes amplitudes en un mismo gráfico) y el número de observaciones por amplitud se representa mediante la altura de la barra.

 

Nos permite observar la distribución de los datos, por ejemplo, es una distribución normal si se concentran al centro y decrecen hacia los bordes, se presenta uniforme u otro tipos de distribución.

Hisotgrama rrhh

Título del Gráfico

Unidad Eje Y

Unidad Eje X

uSOS PARA RRHH

Los histogramas son de utilidad para graficar variables como la edad o antigüedad de los trabajadores, niveles de desempeño y duración de licencias medicas.

¿Cómo se construye el gráfico?

Para este ejemplo, se muestra la distribución de las edades por grupos con intervalos de cinco años cada uno.

 

En el Eje X (abscisas), los intervalos de edades (grupos de 5 años).

En el Eje Y (ordenadas), el número de personas presentes en la fecha del estudio.

 

Se dibujan rectángulos de anchura proporcional al intervalo (en nuestro caso todos tendrán la misma anchura) y de altura igual a la frecuencia absoluta de las personas para cada rango de edad.

¿Cómo INTERPRETAMOS EL GRÁFICO?

Según su distribución podemos decir lo siguiente:

  • Normal o Campana: Si tiene una distribución simétrica y mis datos adquieren una forma acampanada, indica que la media, la moda y la mediana coinciden. Este tipo de distribución se presenta generalmente cuando analizamos las notas de desempeño de los trabajadores.

  • Sesgado: Si los datos se ajustan o muestran tendencia a agruparse hacia la derecha o izquierda, indican que están sesgados. Es la primera alerta para interpretar, por ejemplo, cómo está compuesta la dotación de nuestra organización. Si está sesgada a la izquierda, en una categorización por edad, indicará que mis trabajadores son principalmente jóvenes o iniciantes en su vida laboral, obviamente dependerá de qué tan prominente sea ese sesgo. Ahora, si nuestra unidad del eje x son los días de la semana y nuestro eje Y la cantidad de licencias emitidas, para un gráfico sesgado hacia la derecha, indicaría que los días jueves y viernes, son los días en que nuestros trabajadores presentan más licencias.

  • Bimodal: En este tipo de distribución, existen 2 modas y se presenta, generalmente, cuando realizo análisis de la composición de la dotación por edad. Por ejemplo, cuando existe una gran concentración de jóvenes y de personas con edades avanzadas, pero hay escasa presencia de trabajadores de edades medias. ¿Eres una de esas organizaciones?¿Cómo se distribuye la dotación en tu organización?

 

Semana 2: Mapa de calor

El Heatmap o Mapa de calor, es una representación gráfica en forma de matriz, que muestra el cruce de datos entre dos dimensiones y los datos que la componen se representan con colores o intensidad de color, dependiendo de los parámetros definidos en su construcción. Puede usarse para cualquier tipo de datos y es útil para mostrar una serie de datos numéricos, no para extraer un  dato específico.

 

Este tipo de gráficos, muestra la concentración de los datos, proporcionando un resumen visual y una visión global del comportamiento de los datos, y facilita a los analistas o consumidores de datos, la interpretación de la información, porque permite alertar y enfocarse en puntos específicos, dependiendo de los parámetros definidos en los colores. Es recomendable, configurar parámetros con un numero de datos(n) significativo para realizar comparaciones más exactas. 

MapaCalor.png

Título del Gráfico

Concentración de Valores

Categoría Eje Y

Categoría Eje X

Las formas de representación de un Mapa de calor, pueden ser múltiples, con formas, manchas, siluetas, etc., sin embargo, cualquiera sea la forma, todas convergen en el uso del color para representar la relación entre valores de datos, que de otra forma sería difícil de entender, como en un excel o en otro tipo de gráfico.

Para construir un Mapa de Calor, debes configurar también la leyenda o la escala de graduación del color. En general, para datos categóricos debes codificar los colores, mientras que para datos numéricos, debes definir una escala de color para representar la diferencia en valores altos y bajos.

uSOS PARA RRHH

En RRHH, el Mapa de Calor se utiliza, en general, para observar la concentración de trabajadores en los distintos segmentos de la organización. Podremos ver de forma visual, la distribución de la dotación activa por estamentos, según su antigüedad en la organización, e identificar cuáles son los grupos con mayor dotación. 

 

Podremos aplicar un mapa de calor para analizar la concentración de los días promedio de ausentismo por persona según 2 variables relevantes: por edad y estamento. En el gráfico de ejemplo, se muestra que al momento de realizar el cruce de variables se obtiene que las personas mayores a 50 años, pertenecientes al estamento Técnico, presentan la mayor concentración de ausentismo. Esto nos permite inferir que podría ser un grupo de riesgo, y que debemos generar planes de acción en este grupo de personas, enfocados en temas de seguridad y salud laboral.

Semana 3: Dispersión

 

Un diagrama de dispersión muestra la relación entre 2 variables numéricas. En general, la variable independiente (aquella que no está influenciada por nada), está en el Eje X, y la variable dependiente, (la que es modificada por la variable independiente) está en el Eje Y. Esta relación se representa con un punto localizado dentro del área de datos, su valor dependerá de las coordenadas del eje X y del eje Y( ejemplo: X1 con Y1, X2 con Y2,….,Xn con Yn).

Una de las  ventaja de este gráfico es que puedes relacionar dos variables distintas entre sí, como por ejemplo: Tasa de egreso (Y) y Días promedio de ausentismo (X) y agrupar por una categoría, que en nuestro ejemplo sería el Área de una organización. Podemos ver la relación entre estas dos magnitudes o parámetros de un problema con el objetivo de encontrar si estas variables tienen alguna relación significativa y si es el caso poder identificar cómo es esa correlación.

grafico dispersion png

Título del Gráfico

Valores Eje Y

Cada punto representa un Área de la Organización

Línea o Recta de regresión

Valores Eje X

uSOS PARA RRHH

Se busca poder relacionar dos variables con el fin de identificar y explicar un fenómeno o comportamiento que nos permita tomar acciones para tratar de mitigar su impacto. Estas son herramientas cuantitativas, pero que no pueden considerarse como absolutas y no pueden ser consideradas como única fuente para basar mis decisiones. Deben ser un complemento a análisis cualitativos de la información.

El ejemplo que se muestra, es un muy buen ejemplo en RRHH, muchas veces queremos entender por qué se produce el egreso de nuestros trabajadores, y si podemos evitar que ocurra, analizando posibles variables que nos alerten este comportamiento, con el fin de observar si existe alguna tendencia o no y de qué magnitud es.

¿Cómo se construye el gráfico?

Para construir un gráfico o diagrama de este tipo, debemos seleccionar aquellas variables que podrían explicar el fenómeno que observamos.

Por ejemplo:

En el Eje X (independiente), los intervalos de días promedio de ausentismo por persona.

En el Eje Y (dependiente), la cantidad de egresos obtenidos a la fecha del estudio.

 

Cada par de dato se representan en el diagrama mediante puntos, reflejando los valores de la clase de datos que se considera dependiente (lo que queremos explicar o efecto) sobre el eje vertical Y y los valores de la clase de datos que se considera independiente (causas) sobre el eje horizontal X. 

Una vez construido el diagrama debemos analizar la forma que tiene la nube de puntos obtenida, con tal de determinar las relaciones entre los dos tipos de datos. Mediante técnicas estadísticas como la recta de regresión y el coeficiente de correlación lineal, obtenemos de forma cuantitativa la existencia de relación y su grado en caso de existir correlación.

El Coeficiente de correlación indica una asociación entre las variables y está representado por una "r". Este coeficiente se mueve en un rango de -1,00 a +1,00. Mientras más cercano a ±1, indica que la relación es más fuerte, en cambio, mientras más cercano a cero, indica que la relación es débil o nula.

De forma gráfica:

Cuando r=+1 la línea tiende a crecer de izquierda a derecha, es decir, Y aumenta cuando X aumenta.

Cuando r=-1 la línea tiende a decrecer de izquierda a derecha, es decir, Y disminuye cuando X aumenta.

Cuando r=0 la línea tiende a ser una línea horizontal, esto quiere decir que el crecimiento de una variable no afecta a la otra.

¿Cómo INTERPRETAMOS EL GRÁFICO?

Según su correlación podemos decir lo siguiente:

  • Correlación Positiva: ocurre cuando una variable aumenta y la otra también. En nuestro ejemplo, la tasa de egreso y los días promedio de ausentismo agrupados por áreas de la organización, mientras que los días promedio de ausentismo (X) aumentan, la tasa de egreso (Y) también. 

  • Correlación Negativa: ocurre cuando una variable aumenta y la otra disminuye. Un aumento de los días promedio de ausentismo (X), causará una disminución de la tasa de egreso (Y). 

  • Sin Correlación o Correlación nula: no existe relación aparente entre las variables, la gráfica no sigue ningún tipo de tendencia, los puntos se encuentran dispersos. En nuestro ejemplo, se observa que los datos no tienen relación, por lo que no podemos asumir que a medida que el trabajador presenta licencias, presentará una mayor (o menor) tasa de egreso de la compañía. La cantidad de días promedio de licencia, parece no tener ningún efecto sobre la tasa de egreso de los trabajadores.​

 

Semana 4: BARRAS

Este es uno de los gráficos más utilizados y muestra la relación entre una variable numérica y una categórica. Cada conjunto de datos, se representa como una barra y su altura es proporcional a su valor numérico.

 

Estas barras pueden presentarse de forma vertical, como en el ejemplo, o de forma horizontal. Independiente de la orientación de la barra, todas deben tener el mismo ancho y no superponerse unas con otras.

Su ventaja radica en la sencillez de interpretación de la data, puesto que permite ordenar y comparar de forma visual los datos según la altura de las barras.

Valores Eje Y

Barras.jpg

Título del Gráfico

Valores Eje X

uSOS PARA RRHH

Son múltiples los usos que podríamos darle a este gráfico para representar la data de RRHH. En este caso, hemos utilizado el gráfico para ver de forma comparativa, en qué día ocurre la mayor emisión de licencias médicas en el periodo de 1 año.

En el Eje X ponemos las variables categóricas que queremos comparar, en este caso los días de la semana. Estas deben ordenarse según su jerarquía.

En el Eje Y ponemos las variables numéricas, valores de la frecuencia relativa o absoluta del dato. En el ejemplo,  el porcentaje sobre el total de licencias emitidas.

tipos de gráfico de Barra

Según las series de datos y como están están representadas:

  • Sencillo: Se representan los datos de una única serie o conjunto de datos, con dos variables, una categórica y una numérica. Esta es la representación básica de este diagrama y es el utilizado para nuestro ejemplo (Distribución de la emisión de licencias médicas por día de la semana).

 

  • Agrupado: Compara los datos de dos o más series o conjunto de datos. Debe usarse el mismo color para identificar a una serie, las barras se colocan una al lado de la otra, por categoría de variable, que permita comparar las series de datos. Por ejemplo, en nuestro mismo gráfico, podríamos agregar la variable género (Serie 1: Hombre / Serie 2: Mujer) y observar el comportamiento por separado.

 

  • Apilado: Al igual que el anterior, representa los datos de dos o más series o conjunto de datos, pero las barras que representan las frecuencias de cada variable, se apilan unas sobre otras. Cada barra representa una categoría de la variable, y se divide en segmentos que representan cada una de las series de datos. Por ejemplo, cada barra muestra de forma simultánea las series de género y la sumatoria de ambas series indica el total.

 

  • Diagrama Bidireccional: Existe otra variación de este gráfico y es utilizado comúnmente para representar pirámides de población, que muestra la población por sexo y rangos de edad, de forma bidireccional y mediante barras horizontales, (en una dirección se representarán los hombres y en el otro las mujeres).

 

Semana 5: LÍNEA

Un gráfico de líneas muestra la evolución de una o más variables numéricas. Los valores del conjunto de datos es representado por puntos y se trazan segmentos lineales entre todos los puntos, conectándolos entre sí para mostrar la variación o evolución a través del tiempo.

grafico Lineas.jpg

Valores Eje Y

Título del Gráfico

Valores Eje X

Línea de Tendencia

uSOS PARA RRHH

Un gráfico de líneas se usa a menudo para visualizar una tendencia en los datos a lo largo de intervalos o series de tiempo breves o extensas (mensuales, anuales, semetrales, etc). Son utilizados además en análisis predictivos de datos y son más eficaces que los gráficos de barras para visualizar el cambios a lo largo del tiempo.

 

En nuestro ejemplo, fue utilizado para evaluar la emisión de licencias por cada mes en un año. Este gráfico puede aplicarse para observar la evolución en el tiempo de variables como dotación, tasa de egreso, costos de capacitación, etc.

¿Cómo se construye el gráfico?

Para construir este gráfico:

En el Eje X se aceptan variables categóricas, numéricas y de fecha-hora, en este ejemplo ponemos los meses del año.

En el Eje Y se aceptan datos numéricos, como la frecuencia relativa o absoluta, en este ejemplo, el porcentaje sobre el total de licencias emitidas.

 

Cada punto registra el porcentaje de las licencias emitidas en cada mes del año y luego se traza una línea entre los puntos que puede ser sólida o con puntos consecutivos.

tipos de gráfico de LÍNEA

Según la cantidad de datos presentados en el gráfico:

  • Gráfico de líneas Simple: Es el utilizado como ejemplo en esta sección. Muestra la tendencia en el tiempo de un dato específico: porcentaje de licencias emitidas en el año

 

  • Gráfico de líneas Multiseries Curvas: Es utilizado para observar el comportamiento para cada categoria del dato en el mismo gráfico. Por ejemplo mostrar la tendencia de emision de licencias médicas para cada causal o tipo de licencia: accidente, enfermedad, etc. 

Semana 6: caja y bigotes

 

Un diagrama de caja y bigotes, ofrece un buen resumen del comportamiento de una o varias variables numéricas.

 

  • La línea que divide el cuadro en 2 partes representa la mediana de los datos.

  • El final del cuadro muestra los cuartiles superior e inferior.

  • Las líneas extremas muestran el valor más alto y más bajo excluyendo los valores atípicos.

Los diagramas de cajas y bigotes se pueden dibujar vertical u horizontalmente.

caja y bigotes.jpg

Extremo Superior

Cuartil Superior

Mediana

Cuartil Inferior

Bigote

Atípicos

Extremo Inferior

uSOS PARA RRHH

El gráfico de caja se utiliza mayormente en RRHH para ver la distribución de compensaciones por banda salarial o tipo de cargo, pudiendo determinar posibles datos atípicos y monitorear la equidad o cuán dispersos están los pagos entre sí, para un mismo cargo.

¿Cómo se construye el gráfico?

Un gráfico de caja y bigotes ordena los valores de dispersión de los datos, identificando la mediana, cuartiles, máximos, minimos, y datos atípicos.

 

Veamos los elementos que constituyen este gráfico:

  • Caja: Rectángulo que abarca el rango de distribución por cuartiles, tramo que va desde el primer cuartil (C1) al tercer cuartil (C3). Incluye el 50 % de las observaciones centrales.

 

  • Mediana: Se reconoce por la línea del medio de la caja, es una medida común en el centro de los datos. Puede graficarse como una línea, un asterisco o una cruz.

  • Bigotes: Son líneas que salen de los costados de la caja, y sirven para identificar las observaciones de datos que están fuera del 50% central de la distribución. Representan el 25% de los datos en la parte inferior y el 25 % de la parte superior, excluyendo a los valores atípicos.

  • Atípicos: Los valores atípicos (outilers) son aquellos puntos que están mas allá del límite inferior o superior. Se marcan con un asterisco o con un punto grande. Aunque algunos paquetes estadísticos incorporan letras para reconocerlas.

  • Mínimo y máximo: Representan el extremo de la distribución de los datos con una línea al extremo externo de cada bigote.

Consideración: Porque un lado de la caja sea más largo que otro, no quiere decir que ese lado contenga más datos. Indica un rango más amplio, por lo que los datos estarán mas dispersos. Un rango menos amplio, indica que los datos están más próximos.

tipos de distribución

Según su distribución, puede ser Simétrica o Asimétrica:

  • Simétrica: La mediana se sitúa en el centro de la caja y tanto la media, mediana y moda coinciden.

  • Asimétrica: Si la mediana corta la caja en dos lados desiguales se tiene:

- Asimétrica postiva: Ocurre cuando la parte más larga de la caja es la parte superior a la mediana. Los datos se concentran en la parte inferior de la distribución. La media suele ser mayor que la mediana.

- Asimétrica negativa: Ocurre cuando la parte más larga de la caja es la inferior a la mediana. Los datos se concentran en la parte superior de la distribución. La media suele ser menor que la mediana.

Semana 7: Anillo

 

El diagrama se representa con forma circular y entrega la proporción de cada uno de los valores de una variable.

 

Consiste en partir el círculo en porciones proporcionales a la frecuencia relativa. El gráfico se divide en sectores y el valor de la suma total de estos sectores debe ser igual a 100%.

Este gráfico compara los valores mostrando las diferencias de longitud y permite que el centro vacío se llene con información adicional.

anillo.jpg

Título del Gráfico

Categoría

Valor Porcentual

uSOS PARA RRHH

Este tipo de gráficos es uno de los más utilizados y puede ser empleado para presentar cualquier tipo de datos.

 

En RRHH son utilizados principalmente cuando se quiere mostrar la distribución de segmentos, tales como:

  • Género de los trabajadores.

  • Distribución de los trabajadores por edad o antigüedad.

  • Distribución de la dotación por tipo de contrato, sindicalizados.

  • Etc.

tipos de gráficos

  • Gráfico circular o de torta: Compara los valores de las categorías y muestra las diferencias que estos tienen, variando el tamaño del ángulo de cada una.

  • Gráfico Semicircular: Se utiliza la mitad del circulo, no obstante, el valor total de este debe seguir siendo de un 100%.

  • Gráfico circular irregular: Compara los datos a través de las diferencias en la longitud del radio de cada segmento. Ejemplo: Encuesta al cliente.

RECOMENDACIONES Y BUENAS PRÁCTICAS

  • Para construir este gráfico, si usas porcentajes, asegúrate de que todos los segmentos sumen el 100%. Aunque no lo creas, es un error muy común.

  • En términos de formato y para mejorar la visualización, evita usar sombras o perspectivas en 3D ya que hace que tus datos sean difíciles de entender.

  • Se recomienda usar este tipo de gráficos solo si la cantidad de sectores es reducida, utiliza hasta 6 sectores. Esto debido a que si se utilizan varias categorías dentro del diagrama no se podrá apreciar de buena manera la distribución porcentual. Si los sectores del círculo tienen aproximadamente el mismo valor, considera usar un gráfico de barras en su lugar.

  • La principal limitación, es que debes especificar dentro del gráfico los porcentajes o valores de la variable, debido a que nuestros ojos no están adaptados para diferenciar los ángulos o sectores de cada categoría.

Semana 8: Nube de palabras

 

Es un método de visualización de datos cualitativos, representados por una concentración de palabras de distintos tamaños.

 

El tamaño de cada palabra está definido por la proporcionalidad de su frecuencia, es decir, a medida que mas se repita o se utilice la palabra, aparecerá mas grande en comparación a las demás. Las palabras pueden estar dispuestas en cualquier orientación y/o formato.

nube palabras.jpg

uSOS PARA RRHH

Utilizar este tipo de gráfica, permite identificar las palabras o conceptos que más se repiten. Por ejemplo podría utilizarse para identificar las palabras que más se repiten al momento de realizar una retroalimentación.

 

Si realizo una pregunta abierta como tipo encuesta de opinión dentro de la organización, me permitirá visualizar cuales son las principales temáticas o comentarios de nuestros trabajadores. Este tipo de análisis cualitativo, se recomienda complementar con otros análisis de texto, como de sentimiento o clasificación.

Consideraciones relevantes

  • Para la construcción de este grafico se debe limpiar la tabla de datos, excluyendo aquellos que no sean relevantes para el análisis, por ejemplo: “…”, “J”, palabras mal escritas, etc.

  • Permite hacer una síntesis rápida de la información o texto. Fíjate en las palabras con mayor repetición y pregúntate si estás teniendo el enfoque adecuado o si se le está dando importancia a lo que quieres o necesitas que se le dé.

  • Este grafico, para textos muy extensos tiende a confundir o no expresar con claridad los comentarios de los trabajadores, se recomienda su uso para analizar textos con un límite reducido de caracteres.

Semana 9: CLUSTER

 

Es un método de segmentación multivariable (varias variables) que se utiliza para clasificar grupos a partir de un conjunto de datos.

 

La clasificación de estos grupos se realiza en base a características similares o que tengan alguna relación (grupos homogéneos). Se busca lograr agrupar los datos mas homogéneos y alejar lo mas posible los clusters(grupos) creados.

Cantidad de Clústeres

cluster.jpg

Variables analizadas o "corridas"

Caracterización del grupo o clúster

uSOS PARA RRHH

Este tipo de análisis, (clúster o agrupación) permite observar de forma estadística la distribución de los grupos de trabajadores existentes en una organización, según género, antigüedad dentro de la empresa, edad, estamento, etc.

 

La ventaja de este tipo de análisis en formato tabular, es que, en base a las diferentes agrupaciones que se obtengan, permite tomar acciones y/o ciertas medidas específicas para ciertos grupos detectados, orientando el foco de gestión.

 

El gráfico presentado, debe leerse de manera vertical, dependiendo de cada Clúster creado. Por ejemplo el Clúster 1 se compone o representa el 56,8% del total de la dotación y este está constituido en un 75% por personas de género Femenino que tienen una edad promedio de 35 años.

Técnicas de clustering

Existen 2 técnicas para realizar clústering:

  1) Jerárquico: Esta técnica tiene por objetivo agrupar clúster para formar uno nuevo o bien separar alguno ya existente para dar origen a otros dos, de tal forma que, si sucesivamente se efectúa este proceso de agrupación o división, se minimice la distancia o bien, se maximice alguna medida de similitud.  

El método jerárquico, dependiendo de la dirección en la que el algoritmo ejecute el agrupamiento, esta subdividido en:

  • Aglomerativos

  • Disociativos.

 

  2) No jerárquico: Esta técnica tiene por objetivo elegir una partición inicial de individuos y después intercambiar a los miembros de estos clúster para obtener una partición mejor. Los grupos ya están establecidos con anterioridad, por lo que solo se asocian elementos a estos grupos iniciales.

 

Semana 10: Radar

Este gráfico se conoce como gráfico de araña, telaraña, estrella, polar, entre otros.

 

Es un método para visualizar datos multivariados, donde cada esquina muestra una sola observación. Permite identificar y comparar las distancias entre valores reales y valore ideales.

radar.jpg

uSOS PARA RRHH

Este gráfico se puede utilizar para evaluar los resultados obtenidos en un estudio de clima organizacional, en el que cada punta sea una dimensión de evaluación, por ejemplo, Liderazgo, Jefatura, trabajo en equipo, desarrollo laboral, etc. Podremos ver en las distintas dimensiones, el nivel aprobación global de la organización.

 

Tener este insight nos servirá como base para implementar planes de acción y de seguimiento para mejorar las dimensiones encontradas más bajas o débiles. 

 

También podría ser utilizado para evaluar el desempeño individual (por trabajador) o por equipo de la organización. El grafico nos permitirá identificar las fortalezas y debilidades que estos puedan tener, es útil para evaluar si el desempeño obtenido cumple con los esperados y así poder plantearse mecanismos para mejorar las debilidades y potenciar las fortalezas.

Consideraciones relevantes

  • Se deben determinar las categorías a evaluar y distribuirlas de manera proporcional en cada esquina dentro del diagrama.

  • Se deben seleccionar a los elementos que se evaluarán y en base a los resultados de los datos que se obtengan se colocaran puntos y estos se unirán con líneas rectas de una categoría a otra, dando una forma de radar dentro del diagrama.

  • Se recomienda que al usar gráficos radiales no se utilicen muchas variables para no generar confusión, esto debido a que visualmente puede obstaculizar el no poder identificar los elementos evaluados.