.

Inteligencia Artificial

Un brazo robótico virtual logra enseñar a otro a resolver distintas tareas

1

Al jugar un juego en el que uno intenta ser más astuto que el otro, los bots de OpenAI aprendieron a resolver retos como poner la mesa y colocar piezas de ajedrez sin tener que entrenar para cada uno. Ahora falta transferir este avance al mundo real

  • por Will Douglas Heaven | traducido por Ana Milutinovic
  • 01 Febrero, 2021

Un brazo robótico virtual ha aprendido a resolver una amplia variedad de rompecabezas diferentes (apilar bloques, poner la mesa, colocar las piezas de ajedrez) sin tener que volver a entrenarse para cada tarea concreta. Para lograrlo, se dedicó a jugar contra otro brazo robótico entrenado para desafiarlo de una forma cada vez más difícil.

Autojuego: dos brazos robóticos idénticos, Alicia y Roberto, desarrollados por investigadores de OpenAI, aprenden jugando entre ellos en un entorno simulado, sin intervención humana. Los robots utilizan aprendizaje reforzado, en el que los sistemas de inteligencia artificial (IA) se entrenan mediante ensayo y error sobre qué acciones tomar en diferentes situaciones para lograr ciertos objetivos. El juego consiste en mover objetos sobre una mesa virtual. Al ordenar los objetos de formas concretas, Alicia intenta proponer tareas que a Roberto le resulten difíciles de realizar. Roberto trata de resolver las tareas de Alicia. A medida que aprenden, Alicia formula problemas cada vez más complejos y Roberto los soluciona cada vez mejor.

Foto: Después de entrenarse con los rompecabezas de bloques inventados por Alicia, Roberto puede generalizar la solución de una variedad de tareas, como poner la mesa y colocar las piezas de ajedrez.

Multitarea: los modelos de aprendizaje profundo generalmente se tienen que volver a entrenar para abordar cada tarea. Por ejemplo, AlphaZero (que también aprende jugando contra sí mismo) utiliza un solo algoritmo para enseñarse a sí mismo a jugar al ajedrez, shogi y Go, pero solo puede hacerlo con un juego a la vez. El AlphaZero que sabe jugar al ajedrez no sabe cómo jugar al Go y el que juega al Go no es capaz de jugar al shogi. Construir máquinas realmente capaces de realizar múltiples tareas es un gran tema sin solucionar en el camino hacia una IA más general.  

Dojo de IA: uno de los problemas consiste en que entrenar a una IA para realizar múltiples tareas requiere una gran cantidad de ejemplos. OpenAI lo evita entrenando a Alicia para que genere los ejemplos para Roberto, es decir, se usa una IA para entrenar a otra. Alicia aprendió a establecer metas como construir una torre de bloques, luego levantarla y balancearla. Roberto aprendió a utilizar las propiedades del entorno (virtual), como la fricción, además de agarrar y girar los objetos.

Realidad virtual: hasta ahora, este enfoque solo se ha probado en un entorno simulado, pero los investigadores de OpenAI y otros lugares están mejorando las formas de transferir los modelos entrenados en entornos virtuales a entornos físicos. La simulación permite que los sistemas de IA analicen grandes conjuntos de datos en un corto período de tiempo, antes de adaptarlo todo a las condiciones del mundo real.

El objetivo general: los investigadores afirman que su meta final es entrenar a un robot para que resuelva cualquier tarea que una persona pueda pedirle. Al igual que el modelo de lenguaje GPT-3, capaz de usar el lenguaje en una gran variedad de formas diferentes, estos brazos robóticos son parte de la ambición general de OpenAI de crear una IA multitarea. Usar una IA para entrenar a otra podría ser una parte clave de ese propósito. 

Inteligencia Artificial

 

La inteligencia artificial y los robots están transofrmando nuestra forma de trabajar y nuestro estilo de vida.

  1. Una IA basada en GPT-2 ofrece ayuda a adolescentes LGTBQ en crisis

    Los orientadores voluntarios del Proyecto Trevor necesitan formarse antes de atender las peticiones de ayuda de este colectivo, y los responsables han encontrado en la inteligencia artificial una herramienta ideal para recrear una conversación en la que el sistema actúa como un joven con pensamientos suicidas 

  2. Cassie, el robot que aprendió a andar solo, amenaza a Boston Dynamics

    Los videos del gigante de la robótica resultan impresionantes, pero tienen truco: sus máquinas requieren ajustes manuales para sus acrobacias. En cambio, este robot bípedo descubrió cómo caminar por el mundo real y recuperarse de un tropiezo sin ayuda gracias al aprendizaje reforzado

  3. Las 10 bases de datos de IA más conocidas están llenas de errores de etiquetado

    Famosos conjuntos como ImageNet y MNIST, usados ampliamente para entrenar otros modelos, incluyen numerosas etiquetas incorrectas, según ha descubierto el MIT. El problema puede estar generando algoritmos defectuosos de forma insconsciente que luego se acaban aplicando en el mundo real