.

Otros

Sergey Levine

1

Enseña a los robots a observar y aprender de sus propios logros para asumir tareas que antes parecían imposibles

  • por ? | traducido por Teresa Woods
  • 31 Agosto, 2016

Durante sus nueve meses en Google, Sergey Levine observó cómo el programa de la empresa AlphaGo venció al mejor jugador humano del antiguo juego chino Go en marzo. Levine, un especialista en robótica de la Universidad de California en Berkeley (EEUU), admiró la sofisticada hazaña del aprendizaje de máquinas pero no pudo evitar centrarse en una evidente carencia de los potentes algoritmos. "Nunca sujetó ninguna de las piezas", bromea.

Los creadores de AlphaGo entrenaron al programa alimentando un potente algoritmo de red neuronal con 160.000 partidas anteriores de Go. Esa una técnica similar a la que se usa con los algoritmos que han estudiado innumerables fotos de gatos y perros hasta aprender a reconocerlos en fotos no etiquetadas. Pero esta técnica no es fácilmente aplicable al entrenamiento de un brazo robótico.

Foto: Sergey Levine ha demostrado que sus algoritmos pueden ayudar a que un brazo robótico se autoenseñe a manipular varios objetos. Crédito: Daniel Berman.

Así que los expertos en robótica han recurrido a una técnica distinta: el científico le marca un objetivo al robot, por ejemplo el de enroscar la tapa de una botella, pero permite a la máquina averiguar los pormenores por sí sola. Al intentar realizar la tarea una y otra vez, finalmente alcanza la meta. Pero el proceso de aprendizaje requiere muchos intentos, y no funciona para tareas complejas.

El avance de Levine emplea el mismo tipo de algoritmo que ha destacado tanto en la clasificación de imágenes. Primero proporciona al robot versiones fáciles de resolver de la tarea entre manos, como por ejemplo que enrosque la tapa. El robot entonces estudia retrospectivamente sus propios éxitos. Observa cómo los datos de su sistema de visión corresponden con las señales motoras de la mano robótica que realiza correctamente la tarea. El robot supervisa su propio aprendizaje. "Realiza una ingeniería inversa de su propio comportamiento", explica Levine. Entonces puede aplicar lo aprendido a la realización de otras tareas relacionadas.

Con la técnica de inteligencia artificial, algunas tareas robóticas que parecían imposibles de repente se han vuelto alcanzables, gracias a la masiva mejora de la eficiencia de entrenamiento. De pronto, los robots se están volviendo mucho más listos.

—Andrew Rosenblum

Otros

  1. De la llegada a la Luna al desarrollo de la IA: el papel de las universidades en la innovación

    Capacitar a las universidades para que se mantengan a la vanguardia de la investigación en IA será clave para hacer realidad el potencial de este campo a largo plazo.

    Cuatro columnas y un frontón griego sobre torres de servidores mientras un investigador mira un portátil en un carro de servidores.
  2. Es hora de jubilar el término "usuario"

    La proliferación de la IA significa que necesitamos una nueva palabra.

    Chica con un móvil en la mano vista a través de un cristal roto
  3. Elevar tu casa o abandonarla: el dilema del cambio climático en Luisiana

    La costa suroeste de Luisiana se enfrenta a algunas de las predicciones climáticas más severas de Estados Unidos. ¿Puede un proyecto gubernamental levantar la zona y sacarla de la crisis?

    Una casa de estilo A-frame en Luisiana, elevada sobre pilares de cemento, preparada para inundaciones. Con dos pisos, su fachada roja contrasta con el cielo parcialmente nublado. Al fondo, se ve el bayou.