.

Inteligencia Artificial

La IA supera una prueba humana de creatividad, aunque esto no signifique ser creativa

1

Los grandes modelos lingüísticos imitan cada vez mejor la creatividad humana. Sin embargo, eso no significa que sean realmente creativos

  • por Rhiannon Williams | traducido por
  • 18 Septiembre, 2023

La inteligencia artificial (IA) supera cada vez mejor las pruebas diseñadas para medir la creatividad humana. En un estudio publicado la semana pasada en Scientific Reports, los chatbots de IA recibieron puntuaciones medias más altas que los humanos en la Tarea de Usos Alternos (AUT, por sus siglas en inglés), una prueba utilizada habitualmente para evaluar esta capacidad.

Este estudio aviva el debate entre los investigadores de la IA sobre lo que significa que un ordenador supere pruebas diseñadas para humanos. Los resultados no indican necesariamente que las IA estén desarrollando la capacidad de hacer algo exclusivamente humano. Podría tratarse simplemente de que las IA pueden superar pruebas de creatividad, no de que sean realmente creativas en el sentido que nosotros entendemos. Sin embargo, investigaciones como ésta podrían ayudarnos a comprender mejor cómo los humanos y las máquinas abordan las tareas creativas.

Los investigadores empezaron pidiendo a tres chatbots de IA (ChatGPT y GPT-4 de OpenAI, así como Copy.Ai, basado en GPT-3) que propusieran el mayor número posible de usos para una cuerda, una caja, un lápiz y una vela en tan solo 30 segundos.

Sus instrucciones pedían a los grandes modelos lingüísticos que propusieran usos originales y creativos para cada uno de los objetos y explicaban que la calidad de las ideas era más importante que la cantidad. Cada chatbot se probó 11 veces con cada uno de los cuatro objetos y los investigadores dieron las mismas instrucciones a 256 participantes humanos.

Los investigadores utilizaron dos métodos para evaluar las respuestas de la IA y las humanas. El primero consistió en un algoritmo que valoraba el grado de similitud entre el uso sugerido para el objeto y su finalidad original. El segundo se centró en pedir a seis evaluadores humanos (que desconocían que algunas de las respuestas habían sido generadas por sistemas de IA) que valoraran cada respuesta en una escala del 1 al 5 en función de lo creativa y original que fuera: 1 para nada y 5 para mucho. A continuación, se calcularon las puntuaciones medias de las personas y las IA.

Aunque en promedio las respuestas de los chatbots se calificaron como mejores que las de los humanos, las respuestas humanas mejor puntuadas fueron superiores.

Si bien el propósito del estudio no era demostrar que los sistemas de IA son capaces de sustituir a los humanos en funciones creativas, plantea cuestiones filosóficas sobre las características propias de los humanos, afirma Simone Grassini, profesora asociada de Psicología de la Universidad de Bergen (Noruega), que codirigió la investigación.

"Hemos demostrado que en los últimos años la tecnología ha dado un salto muy grande cuando hablamos de imitar el comportamiento humano", afirma. "Estos modelos están en constante evolución".

Demostrar que las máquinas pueden rendir bien en tareas diseñadas para medir la creatividad en humanos no demuestra que sean capaces de algo parecido al pensamiento original, afirma Ryan Burnell, investigador asociado del Instituto Alan Turing (Reino Unido), que no participó en la investigación.

Los chatbots que se probaron son "cajas negras", es decir, no sabemos exactamente con qué datos se entrenaron ni cómo generan sus respuestas, afirma. "Lo que es muy plausible que ocurra aquí es que un modelo no genere nuevas ideas creativas, sino que se base lo que ha visto en sus datos de entrenamiento, que podrían incluir exactamente esta tarea de usos alternativos", explica. "En ese caso, no estamos midiendo la creatividad, sino el conocimiento previo del modelo sobre este tipo de tarea".

Eso no significa que no siga siendo útil comparar cómo abordan determinados problemas las máquinas y los humanos, afirma Anna Ivanova, investigadora postdoctoral del Instituto Tecnológico de Massachusetts (MIT) que estudia los modelos lingüísticos y no ha trabajado en el proyecto.

Sin embargo, hay que tener en cuenta que, aunque los chatbots son muy buenos respondiendo a peticiones concretas, unos ligeros retoques, como reformular una petición, pueden bastar para que dejen de rendir igual de bien, señala. Ivanova cree que este tipo de estudios debería llevarnos a examinar la relación entre la tarea que pedimos a los modelos de IA y la capacidad cognitiva que intentamos medir. "No deberíamos suponer que las personas y los modelos resuelven los problemas de la misma manera", concluye.

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. El polígrafo de la IA: esta herramienta ayuda a detectar patrañas en chatbots

    En muchas situaciones de alto riesgo, no merece la pena arriesgarse con grandes modelos lingüísticos. Saber qué resultados hay que desechar puede arreglarlo. 

    Un toro mirando al frente con una máquina de polígrafo alrededor del cuello. Detrás, espirales de texto superpuestas.
  2. La ley de la IA de la UE en cuatro claves

    El trabajo duro empieza ahora.

    Un candado azul con las estrellas amarillas de la UE de fondo
  3. La IA generativa puede convertir tus recuerdos en fotos que nunca existieron

    El proyecto Synthetic Memories ayuda a familias de todo el mundo a recuperar un pasado que nunca se fotografió

    Una imagen en blanco y negro generada por ai de una mujer y un niño mirando por una ventana