.

Inteligencia Artificial

Hemos probado dos IA de contratación de personal y ninguna nos gusta

1

Curious Thing nos dio 6 sobre 9 en inglés a pesar de estar hablando en alemán y MyInterview dedujo rasgos de personalidad a partir de la entonación. Este experimento demuestra que, aunque la inteligencia artificial puede ayudar a reducir sesgos en procesos de selección, su rendimiento es muy imperfecto

  • por Sheridan Wall | traducido por Ana Milutinovic
  • 13 Julio, 2021

Después de más de un año desde que empezara la pandemia de coronavirus (COVID-19), millones de personas están buscando empleo. El software de contratación con tecnología de inteligencia artificial (IA) pretende ayudar a los empleadores a filtrar las solicitudes para encontrar a las personas más adecuadas para el trabajo. Las empresas especializadas en esta tecnología informaron de un aumento de su negocio durante la pandemia.

Pero, a medida que crece la demanda de estas tecnologías, también se acumulan las preguntas sobre su precisión y fiabilidad. Así que hemos decidido probar el software de dos empresas especializadas en IA de entrevistas de trabajo, MyInterview y Curious Thing. Hemos encontrado distintas predicciones y puntuaciones para los puestos de trabajo solicitados que generan inquietudes sobre qué están evaluando exactamente estos algoritmos.

Llegar a conocernos

MyInterview mide los puntos destacados del Big Five Personality Test (el Modelo de los Cinco Grandes Rasgos), la evaluación psicométrica que se usa a menudo en procesos de contratación. Estos rasgos incluyen la honestidad, la responsabilidad, la extroversión, la amabilidad y la estabilidad emocional. Curious Thing también mide rasgos relacionados con la personalidad, pero en vez de los cinco grandes, los candidatos son evaluados en otras métricas, como la humildad y la resiliencia.

Un informe generado por un programa de IA muestra un resumen de la personalidad y un análisis que indica que el candidato es innovador y social.

Foto: Esta captura de pantalla muestra la puntuación y el análisis de personalidad de nuestra candidata en MyInterview después de responder a todas las preguntas de la entrevista en alemán en vez de en inglés. Créditos: Hilke Schellmann

Los algoritmos analizan las respuestas de los candidatos para determinar sus rasgos de su personalidad. MyInterview también realiza puntuaciones que indican cuánto coincide un candidato con las características identificadas como ideales para el puesto por los responsables de contratación.

Para completar las pruebas, primero configuramos el software. Subimos una publicación de un falso puesto de trabajo para administrador / investigador de oficina tanto en MyInterview como en Curious Thing. Luego creamos nuestro candidato ideal eligiendo los rasgos relacionados con la personalidad cuando el sistema lo solicitó.

En MyInterview, seleccionamos características como la atención al detalle y las clasificamos por el nivel de importancia. También elegimos las preguntas de la entrevista, que se muestran en la pantalla mientras el candidato graba las respuestas en vídeo. En Curious Thing, optamos por características como la humildad, la flexibilidad y la resiliencia.

Una de nosotros, Hilke, mostró su interés en el puesto y realizó las entrevistas para el mismo, tanto en MyInterview como en Curious Thing. Nuestra candidata completó una entrevista telefónica con Curious Thing. Primero realizó una entrevista de trabajo común y recibió un 8,5 de 9 en inglés. En el segundo intento, el entrevistador automático le hizo las mismas preguntas y ella respondió a cada un texto en alemán de Wikipedia sobre psicometría.

Sin embargo, Curious Thing le otorgó un 6 de 9 en competencia en inglés. Hilke volvió a hacer la entrevista otra vez y recibió la misma puntuación.

Una captura de pantalla de un panel de software muestra una puntuación de 6/9 para el dominio del inglés.Foto: La captura de pantalla muestra la puntuación de competencia en inglés de nuestra candidata en el software Curious Thing después de responder a todas las preguntas en alemán. Créditos: Hilke Schellmann

Nuestra candidata repitió el experimento con MyInterview. Leyó la misma entrada de Wikipedia en alemán. El algoritmo no solo creó una evaluación de personalidad, sino que también predijo que nuestra candidata sería compatible al 73 % con nuestro puesto de trabajo falso, colocándola en la mitad superior de la lista de todos los solicitantes que habíamos pedido que se presentaran.

MyInterview ofrece a los responsables de contratación una transcripción de sus entrevistas. Cuando miramos la transcripción de nuestra candidata, encontramos que el sistema interpretó sus palabras en alemán como palabras en inglés. Pero la transcripción no tenía ningún sentido. Las primeras líneas, que corresponden a la respuesta proporcionada anteriormente, dicen:

"Así que la humedad es un desastre. Sociología, ¿hierro? Los nematodos extraídos se adaptan. Ubicación segura, los mesones de la primera mitad gamma sus Fortunas están en busca de IMD y anhelan pasar a Eurasia y Z los mesones de esta ubicación en particular".

No compatible

En vez de calificar a nuestra candidata por el contenido de sus respuestas, el algoritmo extrajo los rasgos de su personalidad de su voz, según el psicólogo industrial y organizacional que trabaja con MyInterview Clayton Donnelly.

Pero la entonación no es un indicador fiable de los rasgos de personalidad, resalta el profesor de psicología organizacional e industrial en la Universidad de Rice (EE. UU.) Fred Oswald, y afirma: "Realmente no podemos utilizar la entonación como un dato para la contratación. Eso simplemente no parece justo, fiable ni válido".

El uso de preguntas abiertas para determinar los rasgos de personalidad también plantea desafíos importantes, incluso, o quizás especialmente, cuando ese proceso está automatizado. Es por eso que muchas pruebas de personalidad, como la de los Cinco Grandes, ofrecen a las personas distintas opciones entre las que elegir.

Oswald añade: "El caso es que resulta difícil descubrir la personalidad de esta manera. Hay otras posibilidades para que la IA o los algoritmos y la forma en la que se formulan las preguntas sean más estructurados y estandarizados. Pero no creo que estemos necesariamente ahí en cuanto los datos y diseños que nos brindan los datos".

El cofundador y director de Tecnología de Curious Thing, Han Xu, respondió a nuestros hallazgos en un correo electrónico, resaltando lo siguiente: "Esta es la primera vez que nuestro sistema se pone a prueba en alemán, por lo tanto, es algo muy valioso para que lo investiguemos y ver si revela algo en nuestro sistema".

La paradoja del sesgo

El resultado de las entrevistas impulsadas por inteligencia artificial no suele ser la única métrica que utilizan los empleadores para evaluar a un candidato. Y es que estos sistemas en realidad pueden reducir el sesgo y encontrar mejores candidatos que los entrevistadores humanos. Pero muchas de estas herramientas no se prueban de forma independiente, y las empresas que las crean son reacias a compartir los detalles sobre cómo funcionan, lo que dificulta que los candidatos o los empleadores sepan si los algoritmos son precisos o qué influencia deberían tener en las decisiones relacionadas con la contratación.

El empleado de la plataforma de gestión de propiedades danesa Proper Mark Gray, empezó a usar las entrevistas en vídeo de inteligencia artificial estando en su empleo anterior de Recursos Humanos en la empresa de electrónica Airtame. Gray recuerda que primero incorporó el software, creado por la empresa alemana Retorio, en las entrevistas para ayudarle a reducir el sesgo humano que se suele desarrollar cuando los responsables de contratación conversan con los candidatos.

Aunque Gray no basa sus decisiones de contratación únicamente en la evaluación de Retorio, que también se centra en los rasgos de los Cinco Grandes, sí lo tiene en cuenta como uno de los muchos puntos de datos para elegir a los candidatos. Y afirma: "No creo que sea una solución milagrosa para averiguar cómo contratar a la persona más adecuada".

Su proceso de contratación habitual incluye una llamada de selección y una entrevista con Retorio, en la que invita a la mayoría de los candidatos a participar independientemente de la impresión que hayan causado en la primera selección. Los candidatos elegidos pasarán a una prueba de habilidades laborales, seguida de una entrevista en persona con otros miembros del equipo.

El responsable añade: "Con el tiempo, todas las empresas deberían usar productos como Retorio y el propio Retorio, porque ofrece mucha información. Aunque existen algunas dudas y controversias en la esfera de la IA en general, creo que la pregunta más importante es: ¿somos mejores o peores para analizar el carácter de una persona?"

Gray reconoce las críticas en torno a las herramientas de selección de IA. Una investigación publicada en febrero por Bavarian Public Broadcasting encontró que el algoritmo de Retorio evaluaba a los candidatos de manera diferente cuando usaban distintos fondos de vídeo y accesorios, como gafas, durante la entrevista.

El cofundador y director general de Retorio, Christoph Hohenberger, asegura que, aunque no está al tanto de los detalles sobre los métodos de prueba de los periodistas, la empresa no tiene la intención de que su software sea el factor decisivo para contratar a los candidatos. El directivo resalta: "Somos una herramienta de asistencia que se utiliza en la práctica también junto con el trabajo de las personas del otro lado. No es un filtro automático".

Aun así, las personas que buscan trabajo se la juegan tanto cuando intentan navegar por estas herramientas que seguramente una mayor precaución resulta justificada. Para la mayoría, al fin y al cabo, conseguir empleo no se trata solo de un nuevo desafío o entorno: encontrar trabajo resulta crucial para su supervivencia económica.

Inteligencia Artificial

 

La inteligencia artificial y los robots están transofrmando nuestra forma de trabajar y nuestro estilo de vida.

  1. La horrible 'app' de 'deepfakes' que coloca a mujeres en videos porno

    Se trata de algo sobre lo que los expertos llevan tiempo advirtiendo y eleva este tipo de abusos al siguiente nivel. Las consecuencias psicológicas y sociales de esta especie de violación pueden alargarse durante años y también afectan a los hombres en países donde se castiga la homosexualidad 

  2. Los datos biométricos de los afganos, arma para la venganza talibana

    Con decenas de datos por persona, desde escáneres de iris y vínculos familiares hasta su fruta favorita, el sistema destinado a reducir el fraude en las fuerzas de seguridad del país pondría en peligro a los ciudadanos registrados

  3. El perturbador aumento del uso del reconocimiento facial de EE. UU.

    A falta de regulación federal, un informe revela que las agencias nacionales del país lo utilizan cada vez más, en muchas ocasiones sin una supervisión adecuada, y la tendencia no para de aumentar. Además, muchas de ellas utilizan el controvertido sistema de Clearview AI