El Blog de los Editores de TR

La inteligencia artificial de Google juega al Space Invaders mejor que los humanos

El software nos ha superado en 22 juegos de Atari, pero los otros 20 a los que pierde, como el Comecocos, revelan los retos de la IA

Tom Simonite 27/02/2015

Foto: El software DeepMind de Google jugando al clásico juego de Atari 2600, Space Invaders.

Hay que apuntar una nueva victoria para las máquinas. El software de DeepMind, el grupo de inteligencia artificial de Google, ha aprendido a jugar el clásico juego de la Atari 2600 Space Invaders a un nivel sobrehumano.

Estas noticias nos llegan a través de un nuevo artículo en la revista científica Nature, que afirma que el software aprendió a jugar a 22 títulos clásicos de Atari mejor que un jugador humano experto. Este trabajo pone al día un artículo anterior sobre el mismo software publicado en una conferencia sobre inteligencia artificial a finales de 2013. Entonces el software lo intentó con siete títulos y sólo pudo superar a los humanos en tres de ellos. En aquel momento DeepMind era una start-up independiente.

Poco después Google adquirió DeepMind por 628 millones de dólares (unos 552 millones de euros) y el director ejecutivo de Google, Larry Page, presentó el software en la conferencia TED 2014. MIT Technology Review ahondó en su funcionamiento en un perfil sobre el director de DeepMind, Demis Hassabis, en diciembre del año pasado (ver Así es el hombre que diseña la inteligencia de Google).

Ahora el equipo de Hassabis, llamado Google DeepMind, ha desarrollado una versión más compleja y puesta al día de su "red Q profunda" que se ha enfrentado a 49 juegos de Atari. El hecho de que se convirtiera en un jugador sobrehumano en 22 de ellos, entre ellos Space Invaders, subraya la potencia de la tecnología de DeepMind. Pero el hecho de que fuera peor que los humanos en otros 20 y sólo consiguiera empatar en los demás, nos recuerda que incluso este software sorprendentemente capaz tiene una inteligencia limitada.

El juego clásico Comecocos ilustra claramente la principal limitación del software: que es incapaz de hacer planes a futuro, ni siquiera unos segundos. Eso impide que el sistema sepa cómo atravesar un laberinto a salvo para comer los últimos puntitos y completar un nivel. También es incapaz de aprender que comiendo determinados puntos mágicos puedes comerte los fantasmas que de otra forma debes evitar a toda costa.

El software de DeepMind está atascado en el presente. Sólo puede ver los cuatro últimos fotogramas de vídeo jugado (apenas una 15ª parte de un segundo) para aprender qué jugadas compensan, o cómo usar su experiencia pasada para escoger su siguiente movimiento. Eso significa que sólo puede dominar juegos en los que se puede progresar usando tácticas que tienen resultados muy inmediatos. Algo que lo limita bastante, aunque funciona para algunos juegos de Atari. Aún así, el software de DeepMind ha demostrado ser capaz de crear estrategias aparentemente complejas, como excavar la pelota por la parte de atrás de la pared de bloques en el juego Breakout, algo que hacen los jugadores humanos más expertos.

Hassabis explica que su equipo está trabajando para ampliar la atención y memoria del software, así como de hacerlo capaz de explorar un juego más sistemáticamente que limitándose a hacer movimientos al azar como hace actualmente. Afirma que estos pequeños cambios deberían permitir al software dominar entornos mucho más complejos. Ya se han empezado trabajos para que juegue a juegos de la consola SuperNintendo y para los primeros PC, muchos de los cuales cuentan con entornos 3D sencillos.

Probar juegos cada vez más complejos podría proporcionar incluso un puente al mundo real. "En última instancia la idea es que si este algoritmo es capaz de conducir un coche en un juego de carreras, con algunos cambios será capaz de conducir un coche real", afirmó Hassabis en una conferencia de prensa este martes.

Pero no esperes que el software de DeepMind se ponga al volante de uno de los coches autónomos de Google en un futuro próximo. El trabajo que se está haciendo para aplicar la investigación del grupo a los problemas del mundo real se centra en los productos clave de la empresa, como la búsqueda, las funciones de ayudante móvil y la traducción, explica Hassabis. "Imagina que pudieras preguntarle a la aplicación Google algo tan complejo como: 'OK, Google, planifícame un viaje de mochilero fantástico por Europa'", le dijo a MIT Technology Review.

Los servicios como los ayudantes móviles y la traducción automática nos son familiares y son funcionales hasta cierto punto, pero pueden ser frustrantemente limitados. Un software que aprende a ganarte a un videojuego puede parecer emocionante, pero su primer impacto real sobre el mundo probablemente sea dar un (quizá largamente esperado) pulido a servicios que ya usamos.

Para comentar, por favor accede a tu cuenta o regístrate

¿Olvidaste tu contraseña?

Informes Especiales

El futuro de la medicina: un tratamiento para cada paciente

Una ola de avances científicos e inversiones financieras puede estar a punto de marcar el nacimiento de una nueva era de atención sanitaria marcada por la personalización y la precisión. Bienvenidos al futuro de la medicina.

Otros Informes Especiales

Advertisement
Advertisement
Publicidad