Humano + IA en selección: cuándo dos consejos son mejores que uno
Hace pocas semanas se publicó en Electronic Markets (Springer, 2026) uno de los experimentos de campo más relevantes para cualquiera que tome decisiones de contratación con apoyo de tecnología. Schempp, Jung y Sturm trabajaron dentro del área de postventa de Porsche AG y midieron qué pasa cuando un decisor recibe consejo de un experto humano, de un sistema de machine learning, o de ambos al mismo tiempo.
El hallazgo es contraintuitivo y conviene leerlo dos veces: el ensemble humano + ML produce las mejores decisiones, pero solo cuando el decisor reconcilia activamente las dos fuentes. Si las recibe pasivamente, su rendimiento puede ser peor que con un solo consejero. La calidad de la decisión no depende solo de qué información llega, sino de cómo el humano la integra.
Para áreas de talento que ya conviven con CV screeners, scoring algorítmico, pruebas digitales y headhunters de carne y hueso, este resultado redefine la pregunta. Ya no es "humano o IA", sino "cómo armar un proceso donde el decisor se mantenga enganchado con ambos".
El experimento, en una línea
Tres condiciones experimentales: consejo solo humano, consejo solo de ML, y consejo de ambos. En el setting de ensemble los autores observaron que los participantes tendían a integrar menos su propio conocimiento que en los settings de un solo consejero. Es como si la presencia de dos fuentes externas anestesiara el juicio propio. Pero cuando el participante se mantenía enganchado —activamente reconciliando consejo humano, consejo de ML y su propia lectura— la calidad de la decisión final superaba a cualquiera de los settings individuales.
"Cuando los decisores son capaces de integrar conocimiento tanto del consejero humano como del consejero de ML, los settings de ensemble pueden habilitar decisiones más precisas y robustas." — Schempp, Jung y Sturm, 2026.
Hay un segundo hallazgo igual de incómodo: cuando la decisión pasaba del individuo al grupo, el engagement caía. En contextos grupales, los participantes tendían a desentenderse de la integración explícita de evidencia. Quienes sí integraban a todos los decisores y a todos los consejos rendían mejor.
Por qué esto cambia el debate de IA en RR.HH.
En América Latina la conversación sobre IA en selección suele atascarse en dos posturas falsas. Una dice "la IA viene a reemplazar al psicólogo o al headhunter". Otra dice "la IA es un peligro, hay que mantenerla fuera de las decisiones críticas". El paper desarma ambas: el problema no es la presencia de la IA, ni la presencia del humano, sino el diseño de la interacción.
Una organización que entrega una terna acompañada de un puntaje algorítmico, sin un protocolo claro para reconciliar diferencias entre el puntaje y el juicio del entrevistador, está reproduciendo exactamente el escenario de baja calidad descrito por Schempp y colegas: dos fuentes en paralelo y un decisor que termina alineándose con la más cómoda, no necesariamente con la mejor.
Las preguntas concretas que un proceso bien diseñado debe responder:
- ¿Cuándo el resultado de la prueba psicométrica pesa más que la entrevista, y viceversa?
- ¿Qué hace el comité cuando el headhunter recomienda al candidato B y el dashboard del SaaS muestra al candidato A arriba?
- ¿Quién documenta la divergencia y la integración, no solo la decisión final?
Sin estos protocolos, sumar herramientas no mejora la decisión: la diluye.
Recibe nuestra guía de procesos de selección con IA
Plantillas, listas de verificación y errores comunes al integrar evidencia algorítmica con juicio experto en RR.HH.
Cómo aplicar el ensemble al headhunting ejecutivo
Cuando una empresa nos contrata para un cargo crítico, el servicio de headhunting de Obrii ya opera bajo lógica de ensemble: combinamos investigación de mercado, entrevistas estructuradas por competencias, evaluación psicolaboral con instrumentos validados y verificación profunda de antecedentes. Cada terna se entrega con evidencia, no con opinión.
Pero el experimento de Porsche obliga a un paso más: el cliente —el comité ejecutivo, el directorio, el CEO— también debe enganchar con esa evidencia. Por eso en proyectos críticos:
- Entregamos la evidencia antes de la sesión de decisión, no en la misma reunión, para que cada decisor llegue habiendo integrado individualmente.
- Estructuramos la conversación grupal alrededor de divergencias explícitas (¿dónde el informe psicolaboral contradice la impresión de la entrevista?) en vez de pedir un voto rápido.
- Documentamos la integración, no solo la decisión: por qué la evidencia A pesó más que la B, qué riesgo se asume y cómo se mitigará.
Es un proceso más exigente. También es el único que el paper sugiere que produce decisiones consistentemente mejores.
Y para procesos de alto volumen, una plataforma
No todo cargo justifica un headhunting completo. Para flujos de selección recurrentes —analistas, especialistas, vendedores, jefaturas operativas— la lógica de ensemble sigue aplicando pero a otra escala: necesitas una plataforma que entregue evidencia comparable entre candidatos y deje al equipo de RR.HH. integrar esa evidencia con sus entrevistas.
Eso es exactamente Obrii App: pruebas cognitivas y psicométricas validadas, baremos chilenos, scorecards de entrevistas estructuradas y un dashboard donde el equipo ve los resultados antes de decidir. La IA prepara la evidencia; el reclutador decide. Y el diseño del producto empuja al usuario a reconciliar, no a delegar.
Prueba el ensemble en tu propio proceso: 7 días gratis de Obrii App Pro, sin tarjeta.El error que el paper nos invita a no repetir
La conclusión que más debería preocupar a un líder de talento no es la efectividad del ensemble, sino su fragilidad: el ensemble gana solo si el humano se mantiene activo. En el momento en que un decisor recibe pasivamente el output del algoritmo y la opinión del experto, la calidad de la decisión cae por debajo de lo que habría logrado con uno solo de ellos.
Trasladado a contratación: comprar un SaaS de selección sin diseñar el proceso de integración, o contratar un headhunter sin preparar al comité para discutir su evidencia, son dos formas de invertir mal. La tecnología y el experto son palancas; el músculo que las mueve es el diseño del proceso de decisión.
Si tu organización está revisando cómo combina datos y juicio experto en sus contrataciones críticas, conversemos. Y si quieres ver en vivo cómo se integra evidencia algorítmica con criterio humano en un flujo real de selección, el trial de Obrii App es el mejor punto de partida.
Referencias
- Schempp, N. M., Jung, D., & Sturm, T. (2026). Exploring the impact of human and machine learning ensemble advice on organizational decision-making processes. Electronic Markets, 36(57). https://doi.org/10.1007/s12525-026-00910-2
- Lebovitz, S., Lifshitz-Assaf, H., & Levina, N. (2022). To engage or not to engage with AI for critical judgments. Organization Science.
- Logg, J. M., Minson, J. A., & Moore, D. A. (2019). Algorithm appreciation: People prefer algorithmic to human judgment. Organizational Behavior and Human Decision Processes, 151.
- Dietvorst, B. J., Simmons, J. P., & Massey, C. (2015). Algorithm aversion: People erroneously avoid algorithms after seeing them err. Journal of Experimental Psychology: General, 144(1).