
Existe un refrán que dice: “El diablo está en los detalles.” En la evaluación de desempeño, esos detalles marcan la diferencia entre un sistema de gestión que impulsa resultados valiosos y uno que genera confusión o desmotivación. Medir adecuadamente qué hacen los trabajadores (sus comportamientos) y qué logran (sus resultados) es un aspecto crítico en la gestión del desempeño.
Este texto se centra en cómo medir el desempeño como comportamientos, por qué hacerlo de esta manera puede ser relevante y cómo se contrasta con la medición basada únicamente en resultados. También se analizan los sistemas comparativos y absolutos aplicables cuando se evalúan competencias.
1. Medir Competencias
Para evaluar los comportamientos de un trabajador, se agrupan en competencias, que son conjuntos medibles de conocimientos, habilidades y capacidades (KSA) relevantes para el logro de resultados. Medir de forma específica cada competencia ayuda a entender en detalle cómo el trabajador actúa para obtener sus metas.
Ejemplos de competencias:
Servicio al cliente
Comunicación escrita u oral
Pensamiento creativo
Confiabilidad
Competencias Diferenciadoras y Umbral
Existen dos clases de competencias:
Competencias diferenciadoras
Permiten distinguir a los trabajadores de desempeño promedio de aquellos sobresalientes.
Competencias umbral
Son requeridas por todos los trabajadores para alcanzar un estándar mínimo de eficacia en el puesto.
Ejemplo (Gerente de Proyectos de TI):
Gestión de procesos como competencia diferenciadora: Se define como “gestionar actividades de proyectos” y hace resaltar a quien la domina en forma superior.
Gestión del cambio como competencia umbral: Incluye conocimientos de ciencias del comportamiento, habilidades operativas y relacionales, y sensibilidad a los motivadores de las personas. Esta competencia es un requisito indispensable para desempeñarse adecuadamente.
Las competencias deben definirse en términos de comportamiento observable. Por ejemplo, en la docencia virtual, la competencia “comunicación” podría evidenciarse si el profesor:
Cumple con los horarios establecidos para sesiones en línea.
Contesta de forma pertinente las dudas de los estudiantes.
Indicadores y KPIs en la Medición de Competencias
Para saber en qué medida una competencia está presente, se miden indicadores clave de desempeño (KPI), que son comportamientos observables que reflejan si el trabajador posee dicha competencia.
Ejemplo en la competencia “comunicación” de un profesor virtual:
Indicador: Participar puntualmente en foros y sesiones de chat.
Indicador: Responder de manera precisa las preguntas del alumnado.
Se mide la presencia o ausencia de esos indicadores para inferir el nivel de competencia del trabajador.
Ejemplo de Liderazgo: Consideración y Estructura de Iniciación
Dos competencias fundamentales para líderes:
Consideración: Grado en que el líder se interesa por el bienestar de los seguidores.
Estructura de iniciación: Grado en que se establecen claramente responsabilidades de las tareas.
Indicadores de la competencia “consideración”:
Apoyar los proyectos de los colaboradores directos.
Interesarse en el bienestar personal de los trabajadores.
Animar a los colaboradores a alcanzar sus metas.
Mostrar respeto por la vida personal y laboral de los trabajadores.
Descripción de Competencias: Elementos Clave
Para que una competencia sea útil, la descripción debe incluir:
Definición de la competencia
Indicadores conductuales específicos de un desempeño eficaz
Indicadores de comportamientos que evidencian falta de competencia
Lista de sugerencias para desarrollar esa competencia
Ejemplo: “Consideración”
Definición: Preocupación y respeto por los seguidores, apoyo y aprecio por su bienestar.
Comportamientos del líder que demuestra consideración:
Preguntar regularmente por la vida personal de sus colaboradores.
Asignar tareas teniendo en cuenta sus metas de carrera.
Comportamientos que muestran ausencia de consideración:
Focalizar las conversaciones solo en tareas.
Mantener al personal con sobrecarga de trabajo sin motivo.
Sugerencias de desarrollo:
Interesarse en los objetivos de carrera de los colaboradores.
Mostrar reconocimiento en tiempo oportuno.
Subjetividad en la Medición de Competencias
A diferencia de la medición de resultados, medir competencias es más subjetivo. Se basa en juicios de los calificadores (supervisores, compañeros, clientes, el propio trabajador, etc.). Recibir información de varias fuentes, mediante un enfoque de retroalimentación de 360 grados, puede enriquecer y equilibrar las evaluaciones de desempeño.
2. Sistemas Comparativos vs. Absolutos para Medir Competencias
Existen dos enfoques principales para evaluar las competencias (comportamientos):
Sistemas Comparativos: Comparan a los trabajadores entre sí.
Sistemas Absolutos: Comparan el desempeño de los trabajadores con estándares predefinidos.
Sistemas Comparativos y Absolutos para Medir el Desempeño como Competencias
La siguiente tabla muestra ejemplos de métodos comparativos y absolutos:
Comparativo | Absoluto |
Orden de clasificación simple (Rank Order) | Ensayos (Essays) |
Orden de clasificación alterna (Alternation) | Listas de verificación de comportamiento |
Comparaciones por pares (Paired Comparisons) | Escalas de calificación gráfica |
Percentil relativo (Relative Percentile) | - |
Distribución forzada (Forced Distribution) | - |
Para profundizar en los distintos enfoques de evaluación dentro de cada categoría, te recomendamos consultar “Tipos de evaluación de desempeño”, donde se describen características y usos específicos para cada método.
3. Medir Competencias Usando Sistemas Comparativos
Los sistemas comparativos establecen una referencia relativa del desempeño:
Orden de Clasificación (Rank Order)
Los trabajadores se clasifican de mejor a peor. Es simple, pero no muestra qué tan amplias son las diferencias.
Orden de Clasificación Alterna (Alternation Rank Order)
Se alternan posiciones extremas:
Mejor desempeño
Peor desempeño
Segundo mejor
Segundo peor
… hasta clasificar a todos.
Comparaciones por Pares (Paired Comparisons)
El desempeño de cada trabajador se compara con el de todos los demás.
Con n trabajadores, se realizan n(n−1)/2 comparaciones.
Ejemplo: Con 8 trabajadores, se hacen 28 comparaciones para determinar quién supera a quién en cada par.
Percentil Relativo (Relative Percentile)
El calificador ubica a cada trabajador en una escala de 100 puntos, donde el 50% es un desempeño promedio.
Ejemplo: Si a Heather se le asigna un percentil 95, supera al 95% de sus compañeros.
Distribución Forzada (Forced Distribution)
Se asume que el desempeño se distribuye normalmente (en forma de campana).
Un porcentaje fijo de trabajadores se clasifica en cada categoría (por ejemplo, 20% superior, 70% medio y 10% inferior).
Caso de Distribución Forzada: General Electric (GE)
Históricamente, GE empleó la “curva de vitalidad” con la regla 20-70-10, atribuida al ex CEO Jack Welch.
20%: Los mejores (“jugadores A”).
70%: Rango medio.
10%: Categoría más baja, frecuentemente invitada a abandonar la empresa si no mejoraba.
Con el tiempo, la rigidez de la distribución forzada se suavizó, incorporando mayor flexibilidad y revisiones más frecuentes. GE, junto con otras empresas, busca una cultura más innovadora, donde se reconozcan los fracasos como parte del proceso creativo, y se proporcione retroalimentación constante en lugar de una evaluación anual estática.
Ventajas y Desventajas de los Sistemas Comparativos
Ventajas:
Facilidad de explicación: Se ve claramente quién está sobre o bajo el promedio.
Decisiones claras para promociones o despidos, al ubicar a cada trabajador en una distribución.
Control de sesgos: Reduce indulgencia, severidad y tendencia central.
Desventajas:
Clasificación general: No evalúan competencias específicas. Dificultan la retroalimentación detallada.
Distancia desconocida: Se ignora cuánto mejor es un trabajador respecto a otro.
Conflictos y percepción de injusticia: Especialmente con distribución forzada, puede haber tensión entre compañeros.
Descubre cómo KPI Estudios utiliza la Inteligencia Artificial para transformar la evaluación del desempeño en resultados estratégicos visitando www.kpiestudios.com
Problemas Potenciales en la Distribución Forzada
Las críticas se deben a cómo se aplica la evaluación y las consecuencias que genera, más que al método en sí. Si no hay claridad sobre qué se mide, cómo se comunica y qué beneficios o acciones se toman con cada calificación, el sistema puede percibirse como injusto o incluso inexacto. Por ello, cada vez más compañías optan por evaluaciones más continuas y flexibles.
¿Realmente Están Desapareciendo las Calificaciones?
Empresas como Cargill y Adobe han eliminado o modificado significativamente sus sistemas de distribución forzada, introduciendo planes de retroalimentación continua. Sin embargo, esto no significa la desaparición de la evaluación del desempeño, sino que se transforma en un proceso más dinámico:
Retroalimentación regular, no solo en la evaluación anual.
Ajustes en la forma de calificar y retroalimentar, enfocándose en el desarrollo en lugar de la simple clasificación.
4. Forma de la Distribución del Desempeño: ¿Normal o Cola Pesada?
La distribución normal (campana) asume que la mayoría está en un punto medio, con pocos en los extremos. Pero estudios con más de 800,000 casos en distintos campos (ciencia, deportes, literatura, trabajo bancario y otros) han concluido que el desempeño suele tener una distribución con cola pesada:
Hay muchos “trabajadores estrella” que se distancian en gran medida del promedio.
Con una cola pesada, un grupo pequeño puede generar una gran proporción de los resultados. Este hallazgo tiene implicaciones estratégicas:
Identificar y apoyar a los trabajadores estrella.
Eliminar barreras que impidan su óptimo desempeño.
Rotarlos en distintos equipos para maximizar transferencia de conocimientos.
Ofrecer paquetes de retención adecuados.
“La forma más sencilla de no producir trabajadores estrella es no basar los incentivos en el desempeño y promover ascensos solo por antigüedad.”
5. Medir Comportamientos Usando Sistemas Absolutos
En los sistemas absolutos, cada trabajador es evaluado contra un estándar o referente claro, sin compararlo directamente con sus compañeros. Algunas modalidades:
Ensayos (Essays)
El evaluador describe fortalezas, debilidades y sugiere mejoras.
Proporciona retroalimentación muy cualitativa, pero dificulta las comparaciones y cuantificaciones.
Listas de Verificación de Comportamientos (Behavior Checklists)
Se enumeran comportamientos específicos que el evaluador va marcando según la frecuencia o presencia de cada comportamiento.
Útiles para sistematizar la evaluación, aunque el detalle de retroalimentación puede ser limitado.
Incidentes Críticos (Critical Incidents)
Se registran episodios concretos donde un trabajador actuó de forma excepcional (positiva o negativa).
Requiere tiempo y dedicación en la recopilación; es muy útil para ejemplos reales y análisis posterior.
Escalas de Calificación Gráfica (Graphic Rating Scales)
Asignan puntuaciones a un conjunto de dimensiones definidas.
Incluyen descripciones de comportamiento para cada nivel (ej., escala de 1 a 5).
Escalas de Calificación Ancladas en el Comportamiento (BARS)
Versión más sofisticada de las escalas gráficas, que utiliza incidentes críticos como anclas (descripciones detalladas de desempeño bajo, medio y alto).
Ensayos: Ventajas y Retos
Ventaja: Permiten una retroalimentación personalizada y detallada.
Desventaja: Son muy heterogéneos (dependen de la habilidad redactora del evaluador). No resultan en datos cuantitativos de fácil comparación.
Listas de Verificación de Comportamientos
Las listas incluyen afirmaciones de comportamiento que el evaluador marca con categorías como “Siempre”, “Frecuentemente”, “A veces” o “Nunca”. Cada respuesta tiene un peso y la sumatoria da una puntuación final.
Ejemplo de Ítem:
“El trabajador llega a tiempo al inicio de su turno.”
Siempre (5)
Muy a menudo (4)
A veces (3)
Rara vez (2)
Nunca (1)
Escala para Listas de Verificación (Frecuencia)
Escala de 7 puntos | Escala de 5 puntos |
Siempre | Siempre |
Constantemente | Muy a menudo |
Frecuentemente | Frecuentemente |
Frecuentemente | Ocasionalmente |
A veces | Nunca |
De vez en cuando | |
Nunca |
Escala para Listas de Verificación (Cantidad)
Escala de 7 puntos | Escala de 5 puntos |
Todo | Todo |
Extraordinaria | Extrema |
Gran cantidad de | Bastante |
Bastante | Algo |
Moderada | Ninguna |
Algo | |
Ninguna |
Si buscas analizar y mejorar competencias clave con cuestionarios personalizados (90, 180 o 360 grados), explora www.kpiestudios.com/evaluacion-desempeno
Incidentes Críticos
Todo puesto tiene comportamientos que hacen la diferencia entre un desempeño eficaz y uno deficiente. La técnica de incidentes críticos exige documentar de forma puntual estos casos, positivos o negativos.
Ejemplo:
Un trabajador de soporte que ofrece una solución novedosa a un problema de software en tiempo récord (positivo).
Entregar una herramienta sin capacitación ni seguimiento (negativo).
Estos informes son muy útiles para retroalimentar y establecer planes de mejora, aunque demandan alta dedicación en su recopilación.
Escalas de Calificación Gráfica y BARS
Las escalas de calificación gráfica definen categorías claras (p. ej., 1 a 5) asociadas a descripciones de desempeño. El éxito depende de:
Claridad en las categorías de respuesta.
Definición precisa de la competencia o dimensión evaluada.
Consenso entre evaluador y trabajador sobre lo que significa cada calificación.
BARS (Behaviorally Anchored Rating Scales)
Mezclan escalas gráficas con incidentes críticos:
Empleados y supervisores identifican las dimensiones importantes del trabajo.
Otro grupo produce incidentes críticos que reflejan niveles bajo, promedio y alto.
Se asignan valores de escala a cada incidente.
Se organizan en una escala final con descripciones conductuales claras por cada nivel.
Ejemplo (Conocimiento del trabajo):
5 (Excepcional): Demuestra dominio total; capacita a otros.
4 (Avanzado): Completa siempre las tareas; ocasionalmente pide ayuda.
3 (Competente): Conoce su trabajo con algunos apoyos.
2 (Necesita mejora): A menudo incumple plazos, no mejora.
1 (Deficiente): Realiza tareas incorrectamente o no las hace.
Las BARS son más complejas de desarrollar pero permiten retroalimentaciones detalladas y objetivas.
6. Conclusiones Generales y Recomendaciones
Claridad en la Definición de Competencias
Toda medición de comportamientos se basa en competencias específicas y en indicadores conductuales claros.
Selección de Método
Los sistemas comparativos son útiles para diferenciaciones rápidas y decisiones administrativas (ascensos, despidos).
Los sistemas absolutos promueven retroalimentación detallada, enfocada en la mejora individual.
Consideración de la Cultura Organizacional
Modelos como la distribución forzada pueden chocar con culturas que valoran la colaboración, innovación y retroalimentación constante.
Uso de Datos para Toma de Decisiones
Al evaluar comportamientos de forma objetiva, se obtienen datos para planes de mejora, compensación, promoción y estrategias de retención (especialmente para trabajadores estrella).
Retroalimentación Continua
Las revisiones anuales están dando paso a evaluaciones más dinámicas con apoyo de herramientas digitales.
Este enfoque reduce sorpresas y promueve el desarrollo continuo.
Atención a los Trabajadores Estrella
Una minoría de trabajadores puede aportar de forma desproporcionada a los resultados.
Identificarlos, retenerlos y facilitar su rendimiento es clave para el éxito organizacional.
Si deseas conocer un método práctico para implementar estas acciones en el día a día, te recomendamos el artículo “¿Cómo se hace una evaluación de desempeño efectiva?” donde encontrarás pasos concretos para optimizar el proceso.
La evaluación de desempeño basada en comportamientos brinda un análisis más profundo que la medición exclusiva de resultados. Al definir competencias y analizar indicadores de comportamiento, la organización obtiene retroalimentación útil para impulsar la mejora continua. Si bien los métodos comparativos (orden de clasificación, comparaciones por pares, percentil relativo, distribución forzada) pueden facilitar ciertas decisiones, sus limitaciones pueden generar tensiones internas. Por otro lado, los métodos absolutos (ensayos, listas de verificación, incidentes críticos, escalas de calificación gráfica y BARS) ofrecen matices y retroalimentación más rica.
Actualmente, existe un giro hacia evaluaciones más frecuentes y personalizadas, apoyadas en tecnología, que resaltan la importancia de alinear cada sistema de evaluación con la cultura y estrategia de la organización. Finalmente, comprender la verdadera distribución del desempeño (muchas veces con cola pesada) refuerza la urgencia de identificar, motivar y retener a los trabajadores estrella, para potenciar el crecimiento y la competitividad.