← Volver al blog
IA en RRHHSesgo AlgorítmicoEvaluación de TalentoHeadhunting EjecutivoTecnología en Selección

Los dos errores caros con IA en RR.HH.: confiar ciegamente o ignorarla del todo

Por Francisco Fernández

Cuando un área de Recursos Humanos incorpora tecnología a sus procesos de selección, suele transitar por dos errores opuestos. Al principio desconfía de cualquier cosa que tenga "IA" en el nombre: el algoritmo es una caja negra, el psicólogo lleva décadas evaluando, el headhunter conoce el mercado, entonces el output del software se mira con sospecha y, en la práctica, no influye en la decisión. Después, una vez que la organización se acostumbra a las herramientas, pasa al extremo opuesto: el dashboard se vuelve la fuente principal, la entrevista queda como "validación" y el comité termina firmando lo que dice el ranking.

La investigación académica nombra esos dos errores. Al primero lo llamamos algorithm aversion (aversión al algoritmo): la tendencia documentada por Dietvorst, Simmons y Massey (2015) a abandonar un modelo predictivo después de verlo fallar incluso una vez, aunque el modelo siga rindiendo mejor que el juicio humano. Al segundo lo llamamos algorithm appreciation (apreciación al algoritmo): la tendencia, documentada por Logg, Minson y Moore (2019), a preferir un consejo cuando se le dice que viene de un algoritmo, aun cuando el contenido sea idéntico al de un humano.

El paper de Schempp, Jung y Sturm publicado en 2026 en Electronic Markets aporta el siguiente eslabón: cuando un decisor recibe consejo humano y algorítmico al mismo tiempo, ni alinearse pasivamente con uno ni con el otro funciona. Lo único que produce decisiones consistentemente mejores es reconciliar activamente ambas fuentes con el propio juicio. Tanto la aversión como la apreciación al algoritmo son atajos cognitivos que esquivan la integración, y los dos cobran la misma factura: peores decisiones.

Por qué los dos errores son caros en selección

Las decisiones de contratación son particularmente vulnerables a estos dos sesgos porque combinan tres condiciones que la literatura asocia a fallos sistemáticos: información incompleta, urgencia y consecuencias diferidas.

Cuando una empresa cae en algorithm aversion, suele pasar lo siguiente. El equipo invierte en una plataforma de evaluación, los reclutadores aplican las pruebas porque "está en el protocolo", el informe llega, pero a la hora de decidir el comité confía en la "química" de la última entrevista y descarta el dato. Resultado: un candidato con red flags evidentes en las pruebas avanza porque cayó simpático, y la organización descubre el problema seis meses después con un costo de varios sueldos en reemplazo.

Cuando una empresa cae en algorithm appreciation, ocurre lo contrario. La terna se filtra por puntaje, las entrevistas se hacen casi como trámite, y la decisión final mira primero el ranking. Esto deja afuera candidatos cuyas fortalezas relevantes para el puesto no están bien capturadas por los instrumentos —rotación de carrera no convencional, perfil senior cuya inteligencia operativa no se ve en un test cognitivo, motivaciones específicas que solo emergen en conversación—. La organización pierde diversidad de criterios y termina contratando un perfil uniforme, optimizado para el modelo más que para el negocio.

Ambos errores se parecen en lo que ahorran: tiempo cognitivo. Confiar a ciegas en una fuente —humana o algorítmica— es más rápido que reconciliar dos. Y el ahorro se siente real hasta que llega la factura.

El experimento que cambió el ángulo

Schempp y colegas trabajaron con personal del área de postventa de Porsche AG en un experimento controlado. Cada participante resolvió decisiones complejas con apoyo de consejo humano, consejo de un sistema de machine learning, o ambos. Lo que el estudio capturó con detalle son las actividades de toma de consejo: cómo el participante usaba (o no usaba) las dos fuentes, y cómo eso impactaba en la calidad final.

"Cuando los decisores integran activamente su propio conocimiento y reconcilian las distintas fuentes, los settings de ensemble humano-ML mejoran los resultados. En cambio, cuando se alinean pasivamente con una sola fuente, el ensemble puede rendir peor que un solo consejero." — Schempp, Jung y Sturm, 2026.

Llevado a RR.HH., el resultado tiene una traducción directa: el problema no es tener un test, un informe psicolaboral y un headhunter trabajando sobre el mismo cargo. El problema es no haber definido cómo ese decisor —tú, tu comité, tu director— integra esas tres fuentes cuando entran en conflicto.

Cómo se ve un proceso que integra en serio

Algunas señales operativas distinguen a una organización que está integrando, de una que está confiando ciegamente:

  1. Cada fuente tiene un peso explícito por tipo de cargo. Para un rol comercial senior, la entrevista por competencias y referencias pueden pesar más que un test cognitivo. Para un rol técnico junior con alto volumen, la prueba de habilidades pesa más que la entrevista. Este peso se define antes de ver candidatos, no después.
  2. Existe un protocolo escrito para las divergencias. Si el informe psicolaboral dice una cosa y la entrevista dice otra, hay un paso definido: una segunda entrevista de profundización, una prueba situacional adicional, o una conversación de calibración entre el evaluador y el comité. No se promedia ni se elige el más cómodo.
  3. Se prueba con casos reales. Cada cierto tiempo, el equipo revisa decisiones pasadas: qué hizo el comité cuando los datos y el juicio divergieron, qué pasó con esos candidatos, qué se aprende del patrón.
  4. Las herramientas livianas se usan para crear hábito de evidencia. Antes de contratar, simular costos y plazos con la calculadora de costo de una mala contratación; antes de aprobar una promoción, estimar el costo laboral real con el simulador; antes de descartar una alerta de equipo, aplicar el test de burnout CESQT para tener un dato y no una intuición. Cada una de estas micro-evidencias acostumbra al equipo a decidir con dato, no contra él.

¿Cuánto desgaste laboral tienes hoy?

Hazte el test de burnout (CESQT) gratis y anónimo. 20 preguntas, resultado al instante.

Hacer el test gratis

Ninguno de estos pasos requiere una transformación digital. Requiere disciplina y un proceso documentado. La tecnología viene después, cuando el hábito ya está.

Dónde encajan los servicios y el SaaS de Obrii

El headhunting de Obrii y la evaluación psicolaboral están diseñados precisamente para producir el tipo de evidencia que un comité reflexivo puede integrar: informes con lenguaje accionable, no caja negra; ranking de competencias contra el perfil del cargo, no puntaje agregado opaco; riesgos y mitigaciones explícitas, no un veredicto.

Y para los procesos donde el volumen exige una plataforma, Obrii App entrega pruebas cognitivas, psicométricas y de juicio situacional en línea, baremadas al mercado chileno, con resultados que aterrizan en un dashboard pensado para alimentar comités —no para reemplazarlos—. La IA prepara la evidencia, el reclutador la reconcilia, el comité decide.

Empieza a integrar evidencia y juicio en tu proceso: 7 días gratis de Obrii App Pro, sin tarjeta.

El punto que el paper deja sobre la mesa

Schempp y colegas terminan su artículo con una frase que cualquier líder de talento debería tomar literal: "el potencial del ensemble humano-ML solo se realiza con sistemas de información cuidadosamente diseñados que no solo entreguen consejo, sino que apoyen activamente la integración del conocimiento y la decisión colaborativa".

Aplicado a contratación, eso significa que comprar más software no resuelve nada por sí solo. El software ayuda cuando la organización ya tiene la disciplina de integrar evidencia con criterio. Sin esa disciplina, la herramienta se convierte en una nueva forma de no decidir bien. Con esa disciplina, la herramienta es lo que destraba un proceso que ya valía la pena.

Si tu organización está tratando de definir cómo integrar pruebas, entrevistas y juicio experto en sus contrataciones críticas, conversemos. Y si quieres ver cómo se ve un dashboard pensado para integrar y no para reemplazar, el trial de Obrii App es la forma rápida.

Referencias

  • Schempp, N. M., Jung, D., & Sturm, T. (2026). Exploring the impact of human and machine learning ensemble advice on organizational decision-making processes. Electronic Markets, 36(57). https://doi.org/10.1007/s12525-026-00910-2
  • Dietvorst, B. J., Simmons, J. P., & Massey, C. (2015). Algorithm aversion: People erroneously avoid algorithms after seeing them err. Journal of Experimental Psychology: General, 144(1).
  • Logg, J. M., Minson, J. A., & Moore, D. A. (2019). Algorithm appreciation: People prefer algorithmic to human judgment. Organizational Behavior and Human Decision Processes, 151.
  • Lebovitz, S., Lifshitz-Assaf, H., & Levina, N. (2022). To engage or not to engage with AI for critical judgments. Organization Science.
  • Jussupow, E., Spohrer, K., Heinzl, A., & Gawlitza, J. (2021). Augmenting medical diagnosis decisions? An investigation into physicians' decision-making process with artificial intelligence. Information Systems Research, 32(3).