.

Computación

Facebook ya sabe decirte qué sale en una foto

1

Su nueva 'app' combina la capacidad de entender el lenguaje hablado de la pregunta y el contenido básico de la imagen, por ejemplo un gato junto a unos plátanos

  • por Tom Simonite | traducido por Teresa Woods
  • 05 Noviembre, 2015

Foto: Yann LeCun

Una nueva app móvil experimental desarrollada por los investigadores de Inteligencia Artificial de Facebook contesta a preguntas por voz sobre el contenido de las fotos.

Yann LeCun, el director del grupo de investigación de Inteligencia Artificial, presumió de la app, que algún día podría ayudar a los discapacitados visuales, en una ponencia en la conferencia EmTech de MIT Technology Review en Cambridge, Massachusetts (EEUU). Mostró cómo la app respondía a una serie de preguntas sobre varias fotos. En una, un gato olisqueaba un gran racimo de plátanos poco maduros. La app contestó correctamente a preguntas por voz sobre si salía un gato en la foto, qué hacía, sobre qué se encontraban los plátanos y sobre el color de los plátanos (verdes) y del gato (blanco y negro). En otro ejemplo, un perro sujetaba un juguete en la boca. Cuando se le preguntó a qué jugaba el perro, la app contestó correctamente. "Al frisbee".

"Lo que veis no es una falsificación; es un sistema real, y es capaz de contestar preguntas básicas sobre las imágenes", afirmó LeCun. "Un sistema que realmente describe una imagen podría resultar muy útil para los discapacitados visuales".

La app es un ejemplo de cómo los investigadores de inteligencia artificial de Facebook y de otras partes intentan combinar la compresión de lo que aparece en una imagen con la del lenguaje (ver El software de Google dice que en esa foto sale "un grupo de jóvenes jugando al frisbee"). Históricamente, se ha trabajado en esas áreas por separado, pero combinarlos podría crear sistemas más capacitados para entender nuestro mundo y ayudarnos a gestionarlo.

El grupo de investigaciones de LeCun está sobre todo centrado en el uso de una técnica llamada aprendizaje profundo (ver El aprendizaje profundo quiere revolucionar todas las industrias). Este enfoque incluye el desarrollo de software que aprende de los datos y está inspirado en la forma en que se conectan las células cerebrales y trabajan juntas. La técnica ha proporcionado grandes avances en la capacidad de las máquinas de entender el lenguaje natural y reconocer objetos en las imágenes. LeCun cree que pronto habilitará a los ordenadores para que entiendan muchos matices del lenguaje y sean capaces de mantener una conversación básica (ver El hombre que enseña a las máquinas a entender el lenguaje).

La app que lució LeCun este lunes en la conferencia EmTech está alimentada por un modelo de redes neuronales artificiales, desarrollado por su grupo, llamado redes de memoria, que se han demostrado anteriormente capaces de aprender el razonamiento verbal básico al leer unos sencillos cuentos.

Eric Horvitz, el director del laboratorio de investigaciones de Microsoft en Redmond, Washington (EEUU), también habló en el evento EmTech del lunes, y dijo que los sistemas que combinan diferentes habilidades y técnicas de aprendizaje de máquinas representan un importante próximo paso para la inteligencia artificial que permitiría que fuese más potente.

"Podemos empezar a enlazar estas cosas para formar experiencias más grandes", dijo. "Estoy bastante seguro de que los próximos grandes saltos de la inteligencia artificial vendrán de soluciones integradas en lugar del fantástico trabajo realizado hasta la fecha en trozos determinados".

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. Las estrategias de los hackers para sacar provecho del coronavirus

    Gobiernos, empresas y particulares permanecen atentos a cualquier información, y los ciberdelincuentes se están aprovechando de ello. Su principal ataque consiste en enviar correos informativos que parecen proceder de fuentes fiables, como la OMS y los CEO, junto a archivos maliciosos que infectan los ordenadores

  2. Todo lo que se sabe de la carrera por crear el mejor ordenador cuántico

    IBM utiliza cúbits ajustables, que son más fiables, para duplicar su volumen cuántico cada año. Por su parte, Google con sus rápidos cúbits de frecuencia fija, trabaja en la supremacía cuántica. Cada enfoque y cada compañía tiene sus propias ventajas y desventajas, y nadie sabe quién acabará ganando

  3. Ha llegado la hora de que cunda el pánico por el fin de la ley de Moore

    La mayoría de las tecnologías que gobiernan la economía actual se basa en chips cada vez más pequeños y potentes. Pero, a pesar de algunas ingeniosas estrategias, cada vez es más difícil que sigan aumentando su velocidad. O empezamos a invertir en I+D ahora o las industrias no podrán seguir avanzando