La IA, denominada Cicero, se colocó en el 10% de las mejores partidas online contra 82 jugadores humanos, quienes no sabían que competían contra un bot. En un to eo de ocho partidas en el que participaron 21 jugadores, Cicero quedó en primer lugar. Meta ha descrito su trabajo en un artículo publicado en la revista Science.
nAprender a jugar Diplomacy es un gran logro por varias razones. No solo involucra a varios jugadores, que hacen movimientos al mismo tiempo, sino que cada tu o está precedido por una breve negociación en la que los jugadores hablan en parejas en un intento de formar alianzas o unirse contra los rivales. Después de esta ronda de negociación, los jugadores deciden qué piezas mover y si cumplir o no con el trato.
nEn cada momento de la partida, Cicero modela cómo es probable que actúen los otros jugadores según el estado del tablero y sus conversaciones previas con ellos. Luego descubre cómo los jugadores pueden trabajar juntos para beneficio mutuo y genera mensajes diseñados para lograr esos objetivos.
nPara construir Cicero, Meta ha combinado dos tipos diferentes de IA: un modelo de aprendizaje reforzado que determina qué movimientos realizar y un gran modelo de lenguaje que negocia con otros jugadores.
nCicero no es perfecto. Enviaba mensajes que contenían errores, a veces contradiciendo sus propios planes o cometiendo fallos estratégicos. Sin embargo, Meta afirma que los jugadores humanos solían elegir colaborar con IA antes que con otros jugadores.
nResulta algo significativo porque mientras los juegos como el ajedrez o el Go terminan con un ganador y un perdedor, los problemas del mundo real normalmente no suelen tener resoluciones tan sencillas. Lograr acuerdos y soluciones alte ativas es, a menudo, más valioso que ganar. Meta afirma que Cicero es un paso más hacia la IA capaz de ayudar con una variedad de problemas complejos que requieren pactos, desde la planificación de rutas con el tráfico intenso, hasta la negociación de contratos.
n