.

Computación

Facebook ya sabe decirte qué sale en una foto

1

Su nueva 'app' combina la capacidad de entender el lenguaje hablado de la pregunta y el contenido básico de la imagen, por ejemplo un gato junto a unos plátanos

  • por Tom Simonite | traducido por Teresa Woods
  • 05 Noviembre, 2015

Foto: Yann LeCun

Una nueva app móvil experimental desarrollada por los investigadores de Inteligencia Artificial de Facebook contesta a preguntas por voz sobre el contenido de las fotos.

Yann LeCun, el director del grupo de investigación de Inteligencia Artificial, presumió de la app, que algún día podría ayudar a los discapacitados visuales, en una ponencia en la conferencia EmTech de MIT Technology Review en Cambridge, Massachusetts (EEUU). Mostró cómo la app respondía a una serie de preguntas sobre varias fotos. En una, un gato olisqueaba un gran racimo de plátanos poco maduros. La app contestó correctamente a preguntas por voz sobre si salía un gato en la foto, qué hacía, sobre qué se encontraban los plátanos y sobre el color de los plátanos (verdes) y del gato (blanco y negro). En otro ejemplo, un perro sujetaba un juguete en la boca. Cuando se le preguntó a qué jugaba el perro, la app contestó correctamente. "Al frisbee".

"Lo que veis no es una falsificación; es un sistema real, y es capaz de contestar preguntas básicas sobre las imágenes", afirmó LeCun. "Un sistema que realmente describe una imagen podría resultar muy útil para los discapacitados visuales".

La app es un ejemplo de cómo los investigadores de inteligencia artificial de Facebook y de otras partes intentan combinar la compresión de lo que aparece en una imagen con la del lenguaje (ver El software de Google dice que en esa foto sale "un grupo de jóvenes jugando al frisbee"). Históricamente, se ha trabajado en esas áreas por separado, pero combinarlos podría crear sistemas más capacitados para entender nuestro mundo y ayudarnos a gestionarlo.

El grupo de investigaciones de LeCun está sobre todo centrado en el uso de una técnica llamada aprendizaje profundo (ver El aprendizaje profundo quiere revolucionar todas las industrias). Este enfoque incluye el desarrollo de software que aprende de los datos y está inspirado en la forma en que se conectan las células cerebrales y trabajan juntas. La técnica ha proporcionado grandes avances en la capacidad de las máquinas de entender el lenguaje natural y reconocer objetos en las imágenes. LeCun cree que pronto habilitará a los ordenadores para que entiendan muchos matices del lenguaje y sean capaces de mantener una conversación básica (ver El hombre que enseña a las máquinas a entender el lenguaje).

La app que lució LeCun este lunes en la conferencia EmTech está alimentada por un modelo de redes neuronales artificiales, desarrollado por su grupo, llamado redes de memoria, que se han demostrado anteriormente capaces de aprender el razonamiento verbal básico al leer unos sencillos cuentos.

Eric Horvitz, el director del laboratorio de investigaciones de Microsoft en Redmond, Washington (EEUU), también habló en el evento EmTech del lunes, y dijo que los sistemas que combinan diferentes habilidades y técnicas de aprendizaje de máquinas representan un importante próximo paso para la inteligencia artificial que permitiría que fuese más potente.

"Podemos empezar a enlazar estas cosas para formar experiencias más grandes", dijo. "Estoy bastante seguro de que los próximos grandes saltos de la inteligencia artificial vendrán de soluciones integradas en lugar del fantástico trabajo realizado hasta la fecha en trozos determinados".

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. ASML, la empresa que revolucionó la fabricación de chips y quiere seguir haciéndolo

    ‘MIT Technology Review’ se reunió con el CTO saliente, Martin van den Brink, para hablar del ascenso de la empresa a la hegemonía y de la vida y muerte de la Ley de Moore  

    Dos trabajadores de ASML pasan por delante de la máquina UVE de alta apertura numérica en Veldhoven
  2. ‘Chiplets’: el arma de China en su batalla tecnológica contra EE UU

    Al conectar varios chips menos avanzados en uno, las empresas chinas podrían eludir las sanciones impuestas por el gobierno estadounidense.

  3. Esta ciudad china quiere ser el Silicon Valley de los ‘chiplets’

    Wuxi, el centro chino del envasado de chips, está invirtiendo en la investigación de ‘chiplets’ para potenciar su papel en la industria de semiconductores