Biotecnología

La mejor manera de que Siri aprenda a entenderle es criticar sus errores

El aprendizaje reforzado, basado en recompensas que el usuario podría emitir, podría ser la técnica que consiga por fin que los asistentes de conversación dejen de resultar tan frustrantes

por Will Knight | traducido por Teresa Woods
20 Febrero, 2017

Foto: La asistente de voz Siri de Apple. Crédito: Karen Bleier.

Si intenta mantener con Siri, Cortana o Alexa, por breve que sea, puede que la frustración le haga darse cabezazos contra la pared.

A los asistentes de voz se les suele dar bien responder a preguntas sencillas, pero las solicitudes complicadas o cualquier tipo de intercambio de comentarios es un mundo para ellos. Pero esto podría empezar a cambiar a medida que las nuevas técnicas de aprendizaje automático se apliquen al reto del diálogo humano-máquina durante los próximos años.

Durante su ponencia en una importante conferencia de inteligencia artificial (IA) reciente, el profesor de la Universidad de Cambridge (Reino Unido) Steve Young, que también trabaja a tiempo parcial en el equipo de Siri de Apple, explicó cómo los últimos avances están empezando a mejorar los sistemas de diálogo. Young no mencionó su trabajo en Apple sino que se centró en sus investigaciones académicas.

Los primeros asistentes de voz, incluida Siri, emplearon el aprendizaje automático para el reconocimiento de voz pero respondían al lenguaje mediante reglas codificadas. Esto está cambiando a medida que el aprendizaje automático se aplica al procesamiento del lenguaje natural (ver AI’s Language Problem).

Young destacó que el aprendizaje reforzado, la técnica que utilizó DeepMind para desarrollar un programa capaz de vencer a uno de los mejores jugadores de Go del mundo, podría ayudar a avanzar el campo. Mientras que AlphaGo aprendió al jugar miles de partidas contra sí mismo y recibió refuerzos positivos por cada victoria, los agentes de conversación podrían variar sus respuestas y recibir refuerzos positivos (o negativos) en forma de las acciones de los usuarios.

Cuando hablé con él después de su ponencia sobre el aprendizaje reforzado, Young dijo: "Creo que tiene que ser algo grande. El activo más potente del que dispones es el usuario".

Young afirma que los asistentes de voz no necesitarían variar su comportamiento drásticamente para que esto tenga efecto. Solo tendrían que intentar ejecutar una acción de una manera ligeramente distinta. "Se puede hacer de una forma muy controlada. No hay por qué hacer estupideces", detalla el experto.

Durante su ponencia, Young explicó por qué a las máquinas les resulta tan difícil procesar el lenguaje. A diferencia del reconocimiento de imágenes, por ejemplo, el lenguaje se compone, lo que significa que los mismos componentes pueden ser dispuestos de forma distinta para generar significados completamente diferentes. Otro reto clave con el lenguaje es que sólo ofrece una fracción de lo que está pensando otra persona, por lo que a menudo es necesario inferir lo que significa una frase. A un nivel práctico, cuando se alarga una pregunta, es necesario fusionar conocimientos de distintos dominios para interpretarla. Por ejemplo, una pregunta compleja sobre un restaurante puede requerir un entendimiento del tiempo, la ubicación y la comida.

Aun así, Young cree que ha llegado el momento de los asistentes de conversación empiecen a mejorar mucho. "La demanda comercial aún existe, y la tecnología existe", señaló, y añadió: "Creo que durante los próximos cinco años se producirán progresos realmente importantes".

Young se unió a Apple después de adquirir la start-up VocalIQ en 2015. Apple ha sido criticada por quedarse rezagada frente a sus rivales en la carrera en el aprovechamiento de tecnologías basadas en el aprendizaje de máquinas y la inteligencia artificial, pero el trabajo de Young sugiere que esto está lejos de ser cierto. Y la empresa también ha estado esforzándose por abrir sus investigaciones de inteligencia artificial para atraer el mejor talento. La empresa contrató recientemente a Ruslan Salakhutdinov, un profesor de la Universidad de Carnegie Mellon (EEUU), como su primer director de inteligencia artificial, y sus investigadores han empezado a presentar y publicar trabajos por primera vez (ver Apple Gets Its First Director of AI).

Apple no es la única empresa interesada en las tecnologías de conversación. Alexa, de Amazon, un dispositivo para el hogar que depende totalmente del control por voz, se ha convertido en un éxito, y otras empresas se han apresurado a desarrollar productos similares. El de Google, llamado Google Home, utiliza técnicas especialmente avanzadas de procesamiento de lenguaje (ver Google’s Assistant Is More Ambitious Than Siri and Alexa).

Investigadores de IBM, en colaboración con un equipo de la Universidad de Michigan (EEUU), también están experimentando con sistemas de conversación que se aprovechan del aprendizaje reforzado. El profesor de la universidad Satinder Baveja, que participa en el proyecto, dice que el aprendizaje reforzado ofrece una potente manera nueva de entrenar sistemas de diálogo, pero no cree que Siri vaya a adquirir aptitudes de conversación realmente humanas durante su vida.

El experto concluye: "Estos sistemas empezarán a utilizar un contexto más rico. Aunque sí creo que seguirán teniendo un alcance limitado, abordando tareas específicas como reservas de restaurante, viajes, asistencia técnica, y más".

Biotecnología

La mejor manera de que Siri aprenda a entenderle es criticar sus errores

Un nuevo tratamiento a partir de células madre busca curar la epilepsia

Un fármaco diseñado por IA alcanza un hito al avanzar en la fase de pruebas

Falta de protocolos y tratamientos dudosos: los retos de la medicina de la longevidad