.

Computación

Facebook ya sabe decirte qué sale en una foto

1

Su nueva 'app' combina la capacidad de entender el lenguaje hablado de la pregunta y el contenido básico de la imagen, por ejemplo un gato junto a unos plátanos

  • por Tom Simonite | traducido por Teresa Woods
  • 05 Noviembre, 2015

Foto: Yann LeCun

Una nueva app móvil experimental desarrollada por los investigadores de Inteligencia Artificial de Facebook contesta a preguntas por voz sobre el contenido de las fotos.

Yann LeCun, el director del grupo de investigación de Inteligencia Artificial, presumió de la app, que algún día podría ayudar a los discapacitados visuales, en una ponencia en la conferencia EmTech de MIT Technology Review en Cambridge, Massachusetts (EEUU). Mostró cómo la app respondía a una serie de preguntas sobre varias fotos. En una, un gato olisqueaba un gran racimo de plátanos poco maduros. La app contestó correctamente a preguntas por voz sobre si salía un gato en la foto, qué hacía, sobre qué se encontraban los plátanos y sobre el color de los plátanos (verdes) y del gato (blanco y negro). En otro ejemplo, un perro sujetaba un juguete en la boca. Cuando se le preguntó a qué jugaba el perro, la app contestó correctamente. "Al frisbee".

"Lo que veis no es una falsificación; es un sistema real, y es capaz de contestar preguntas básicas sobre las imágenes", afirmó LeCun. "Un sistema que realmente describe una imagen podría resultar muy útil para los discapacitados visuales".

La app es un ejemplo de cómo los investigadores de inteligencia artificial de Facebook y de otras partes intentan combinar la compresión de lo que aparece en una imagen con la del lenguaje (ver El software de Google dice que en esa foto sale "un grupo de jóvenes jugando al frisbee"). Históricamente, se ha trabajado en esas áreas por separado, pero combinarlos podría crear sistemas más capacitados para entender nuestro mundo y ayudarnos a gestionarlo.

El grupo de investigaciones de LeCun está sobre todo centrado en el uso de una técnica llamada aprendizaje profundo (ver El aprendizaje profundo quiere revolucionar todas las industrias). Este enfoque incluye el desarrollo de software que aprende de los datos y está inspirado en la forma en que se conectan las células cerebrales y trabajan juntas. La técnica ha proporcionado grandes avances en la capacidad de las máquinas de entender el lenguaje natural y reconocer objetos en las imágenes. LeCun cree que pronto habilitará a los ordenadores para que entiendan muchos matices del lenguaje y sean capaces de mantener una conversación básica (ver El hombre que enseña a las máquinas a entender el lenguaje).

La app que lució LeCun este lunes en la conferencia EmTech está alimentada por un modelo de redes neuronales artificiales, desarrollado por su grupo, llamado redes de memoria, que se han demostrado anteriormente capaces de aprender el razonamiento verbal básico al leer unos sencillos cuentos.

Eric Horvitz, el director del laboratorio de investigaciones de Microsoft en Redmond, Washington (EEUU), también habló en el evento EmTech del lunes, y dijo que los sistemas que combinan diferentes habilidades y técnicas de aprendizaje de máquinas representan un importante próximo paso para la inteligencia artificial que permitiría que fuese más potente.

"Podemos empezar a enlazar estas cosas para formar experiencias más grandes", dijo. "Estoy bastante seguro de que los próximos grandes saltos de la inteligencia artificial vendrán de soluciones integradas en lugar del fantástico trabajo realizado hasta la fecha en trozos determinados".

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. Balance de la caída de Microsoft: "Muestra lo fácil que es infligir un daño global"

    Pese a la magnitud de la caída de Microsoft provocada por el fallo en la actualización de Crowdstrike, los expertos creen que las consecuencias podrían haber sido peores si se hubiera tratado de un ataque de 'ransomware'. Ya hay soluciones para evitar la llamada "pantalla azul de la muerte". 

  2. Estas estructuras de madera que se moldean solas anticipan el futuro de la arquitectura sostenible

    Achim Menges utiliza técnicas asistidas por ordenador destinadas a hacer los edificios más sostenibles y asequibles

    Menges con una estructura de madera a pequeña escala.
  3. Cómo la gamificación pasó de una fuerza positiva a la coacción

    La gamificación siempre ha sido conductismo disfrazado de píxeles y sistemas de puntos. ¿Por qué hemos caído en ella?

    Collage de mensajes pop up de aplicaciones gamificadas