Categorías para la edad y antigüedad de los trabajadores

Uno de los temas que nos enfrentamos con frecuencia al diseñar un panel de indicadores o bien, cuando requerimos realizar un análisis de nuestros datos es determinar el número de categorías que deberíamos utilizar para analizar una variable. Las categorías nos permiten visualizar la distribución de los datos para analizar la tendencia de estos en una determinada organización y contexto.

 

De forma simplificada, existen dos mecanismos que nos permiten determinar el número óptimo de categorías y el rango de cada una de éstas:

 

  • criterio de experto: en función del tipo de variable y de información ya conocida nos permite determinar de antemano las categorías que sean relevantes de incorporar para el análisis. Para ello, utilizamos información secundaria que nos permita sustentar nuestra decisión. A modo de ejemplo, para diseñar grupos de edad, podríamos planificar cortes generacionales que nos permitan realizar análisis con un sustento teórico (generación x vs millennials).

 

  • criterio estadístico: utilizar diversas técnicas propias de esta disciplina que permiten establecer criterios matemáticos para proporcionar interpretaciones más confiables y precisas. La regla más conocida en este grupo es la de Sturges.

 

Cada uno de estos criterios nos entregan herramientas para definir cuántos grupos y de cuánta amplitud debemos utilizar para representar adecuadamente las variables de edad y antigüedad laboral de los trabajadores.

 

 

A continuación mostraremos las distribuciones de la edad y antigüedad de los trabajadores en el mercado latinoamericano (Benchmark de Indicadores):

5e36dd_5361562828e34ae6bf19b8dec7c0229a_mv2.webp

Como vemos, la mayor concentración se ubica entre los 25 y 45 años.

5e36dd_3f748c76226d48e5af9b2856abb7b2bc_mv2.webp

Iremos revisando cada uno de estos criterios utilizando como ejemplo una organización (manteniendo el anonimato) de 3,000 trabajadores.

¿Quieres recibir novedades de analitica de datos en RRHH?

Criterio de experto

 

Este criterio, con ayuda de información teórica, nos permite diseñar grupos que tengan coherencia con alguna hipótesis de investigación. Tanto para la edad como para la antigüedad del trabajador se requieren diferentes análisis:

 

Edad del trabajador: tradicionalmente se han utilizado las generaciones de las personas y tiene un sustento teórico relevante que nos permite analizar la información de manera adecuada, sin embargo resulta complejo cuando se requiere analizar información en el tiempo ya que la composición de las generaciones va variando a medida que pasa el tiempo. Lo anterior imposibilita la comparabilidad en el tiempo y ese es un objetivo que buscamos en el tiempo. Una alternativa adecuada a esto es buscar cortes de edad “fijos” que permitan comparar la información a través del tiempo, considerando que las personas comienzan a trabajar desde los 18 años hasta la edad de jubilación (entre los 50 y 67 años en latinoamérica) y para ello podemos crear los siguientes cortes de edad (en función de las edades de los hijos:

  1. 28 años: el primer corte lo podemos situar cercano a la edad promedio de nacimiento del primer hijo porque marca un cambio en el estilo de vida de las personas y que también coincide con la edad en que los jóvenes de latinoamérica dejan de vivir con sus padres.

  2. 34 años: el primer hijo comienza la etapa escolar y esto vuelve a impactar el estilo de vida que llevan las personas (asistencia doméstica, cuidado, entre otros).

  3. 48 años: el primer hijo termina su etapa escolar, marcando un nuevo hito en la vida de los trabajadores.

 

De acuerdo al caso que estamos siguiendo, esta sería la distribución en función de la edad de los trabajadores:

5e36dd_c7748625869c489e960f1857ab26cca8_mv2.webp

Antigüedad del trabajador: esta variable alcanza diferentes parámetros en función de la industria y el tipo de trabajo que se desarrolle, pero podríamos distinguir los siguientes cortes:

  1. 1 año: es el tiempo en que el trabajador logra conocer el funcionamiento real de su área en la organización y lo que se espera de él.

  2. 3 años: el trabajador ya se encuentra ambientado en la organización y conoce el funcionamiento de las distintas áreas de la organización.

  3. 7 años: el trabajador ya ha alcanzado un conocimiento profundo y completo del lugar donde habita y probablemente ha perdurado a pesar de varios cambios de estructura organizacional o bien se ha movido de puesto dentro.

 

En función de nuestros ejemplo, esta sería la distribución:

5e36dd_28812eee061f43b196eb53cf179d498e_mv2.webp

Como muestra el gráfico, la distribución se concentra en el último tramo lo que tiene relación con la antigüedad de los trabajadores en esta organización en particular.

 

En los paneles o dashboard que hemos desarrollado para las áreas de recursos humanos, es muy común que se utilicen categorías como las recién descritas. Si quieres revisar qué soluciones automatizadas disponemos para visualizar tus indicadores de forma automatizada te invitamos a visitar la página de Dataline.

banner_dataline.png

Criterio Estadístico

 

Si bien no existe un método universal que determine de forma precisa el número de categorías óptimas, disponemos de diferentes métodos estadísticos, y cuya amplitud de rango o intervalo es idéntica en cada una de las categorías [h = (valor máximo - valor mínimo)/(número de categorías)]

Aquí destacamos las 3 reglas que nos parecen más relevantes para calcular el número de intervalos:

 

Regla de Sturges

intervalos = 1+log(número trabajadores)/log(2)

 

En nuestro ejemplo, que está constituido por 3,054 trabajadores y aplicando la regla de Sturges nos pide disponer de 13 categorías (tanto para la edad y la antigüedad), por lo cual los gráficos quedarían de la siguiente manera:

5e36dd_77ea96957a2c40bd8c9004b12d7d6644_mv2.webp
5e36dd_0cc9f918d787473f85e7457002902d20_mv2.webp

Regla de Scott

ancho intervalos = 3.5*(desviación estándar) *(número trabajadores) ^(-1/3)

De acuerdo con esta metodología quedarían 21 categorías en edad y 16 en antigüedad.

5e36dd_22a342effe974ac285b9da590e92bd0f_mv2.webp
5e36dd_298d4f6c8a9e4caf8ba0bb968862c941_mv2.webp

Regla de Freedman & Diaconis

ancho intervalos =2*(rango intercuartílico) *(número trabajadores)^(-1/3)

En función de lo planteado por Freedman deberíamos analizar 24 categorías para edad y 18 para la antigüedad de los trabajadores.

5e36dd_87c10ec3620747408abd3c1dc2baa51c_mv2.webp
5e36dd_6951f84d071544a0965f8175ddd2b0d4_mv2.webp

Si bien no existe ninguna regla empírica que determine el número óptimo de intervalos, es irremplazable el criterio que tenga el investigador o bien quién se encuentra guiando el análisis.

 

Utilizar un criterio estadístico les puede ser de utilidad para realizar análisis de distribución de los datos, es decir, observar donde se encuentran las mayores concentraciones. Como vimos la edad se concentra entre los 30 y 45 años mientras que la antigüedad se concentra en los primeros años.

 

Sin embargo, si requieren realizar análisis bivariados, es decir como se comporta una variable como el ausentismo según el grupo de edad les recomendamos utilizar el criterio teórico que contiene un número acotado de categorías y les permitirá observar diferentes tendencias.