Una IA ha aprendido a engañar a los oponentes humanos en el juego de tablero de guerra Stratego, que viene con información imperfecta y una multitud de posibles escenarios de juego.

tecnología


1 de diciembre de 2022

Una mirada a la estructura del juego de mesa Stratego

El juego de mesa de inspiración napoleónica Stratego tiene una variedad de posibles estados de juego.

Rod Zadeh/Shutterstock

Una IA puede derrotar a jugadores humanos experimentados en el juego de mesa Stratego, que ofrece más escenarios de juego posibles que el ajedrez, el go o el póquer.

Desarrollada por la compañía británica DeepMind, la IA se convirtió en uno de los mejores jugadores en línea del juego de mesa napoleónico Stratego al aprender a farolear con piezas más débiles y sacrificar piezas importantes para ganar.

“Para nosotros, el comportamiento más sorprendente fue [the AI’s] Capacidad de sacrificar piezas valiosas para obtener información sobre la alineación y la estrategia de tu oponente”, dice Julien Perolat de DeepMind.

El juego Stratego consiste en dos jugadores que intentan capturar la bandera del oponente escondida entre una fila de 40 fichas. La mayoría de las piezas están formadas por Soldados numerados del 1 al 10, y los Soldados de mayor rango derrotan a los Soldados de menor rango en encuentros en el tablero. Pero los jugadores no pueden ver las identidades de los peones opuestos a menos que dos peones de ejércitos opuestos se encuentren, a diferencia de juegos como Chess o Go, donde ambos jugadores pueden ver todo.

Este desafío se ve agravado por el hecho de que Stratego es un juego de 10 jugadores enormemente complejo.535 posibles situaciones de juego. En comparación, el juego Go tiene 10360 puntuaciones posibles. El ajedrez y el póquer tienen aún menos.

Perolat y sus colegas de DeepMind desarrollaron su IA «DeepNash» para conquistar Stratego jugando ellos mismos más de 5.500 millones de juegos con un tiempo de entrenamiento de simulación aproximadamente equivalente a cientos de años. Pero la IA no se basó en el conocimiento específico del juego de la estrategia humana como lo hizo la IA de StarCraft de DeepMind. Tampoco se ha entrenado para jugar contra oponentes específicos.

En lugar de intentar jugar escaneando todos los escenarios de juego posibles, lo que sería computacionalmente imposible, DeepNash AI tiene un algoritmo que alinea continuamente su comportamiento hacia una estrategia óptima basada en la teoría económica del juego, dice Karl Tuyls de DeepMind. La estrategia óptima es aquella que garantiza al menos una tasa de victorias del 50 por ciento contra un oponente perfecto, incluso si el oponente sabía exactamente lo que estaba haciendo la IA.

El resultado es una IA capaz de tomar decisiones ganadoras a pesar de tener información oculta sobre sus oponentes, una gran cantidad de posibles estados del juego y muchas acciones diferentes posibles para realizar durante cada ronda. «Es algo nuevo que realmente no podíamos hacer antes», dice Julian Togelius de la Universidad de Nueva York.

DeepNash ya ha dominado a oponentes humanos y de IA. Logró una tasa de victorias del 84 por ciento en 50 partidas igualadas contra jugadores humanos experimentados a través de una plataforma de juegos en línea y se convirtió en uno de los tres mejores jugadores, sin que los oponentes humanos se dieran cuenta de que estaban jugando contra una IA.

DeepMind AI también logró una tasa de victorias del 97 por ciento contra los mejores bots que jugaban Stratego, incluidos varios que habían ganado previamente el Campeonato Mundial de Computer Stratego.

«Los buenos jugadores tienden a memorizar las piezas de sus oponentes y predecir sus patrones de despliegue», dice Georgios Yannakakis de la Universidad de Malta. «DeepNash hace ambas cosas bien, probablemente con una ventaja competitiva en términos de memoria, y juega de forma interesante e impredecible, mostrando elementos de farol».

El enfoque de teoría de juegos de DeepNash podría resultar útil en situaciones que no son de juego, en las que las IA necesitan competir con otros actores inteligentes, como en los negocios y la defensa, dice Tuomas Sandholm de la Universidad Carnegie Mellon en Pensilvania.

Referencia de la revista: CienciasDOI: 10.1126/ciencia.add4679

Más sobre estos temas:

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí