Según informan los investigadores, un agente de IA desarrollado recientemente llamado "DeepNash" ha aprendido a jugar a Stratego, uno de los pocos juegos de mesa que la IA aún no ha dominado al nivel de humanos expertos. Esto supone un "resultado extraordinario que la comunidad de Stratego no creía que hubiera sido posible con las técnicas actuales", afirman los autores del estudio. Durante muchos años, el juego de mesa Stratego, que pone a prueba la capacidad del jugador para tomar decisiones relativamente lentas, deliberativas y lógicas de forma secuencial, ha constituido una de las próximas fronteras de la investigación en IA. Stratego, un juego de información "imperfecta" (en el que algún aspecto del juego está oculto a los oponentes), plantea desafíos clave para los investigadores de IA debido a los muchos aspectos complejos de su estructura, entre ellos tener más estados posibles que otro juego de información imperfecta bien investigado: la modalidad de juego de póker Texas Hold'em sin límite. Actualmente, no es posible utilizar técnicas de búsqueda de información imperfecta para dominar Stratego. En esta ocasión, Julien Perolat y sus colegas presentan un método novedoso que permite a una IA aprender a jugar a este juego. Este nuevo método resultó en un bot llamado DeepNash que logró un rendimiento humano a nivel de experto en la variante más compleja del juego, Stratego Classic. En el núcleo de DeepNash se encuentra un algoritmo de aprendizaje de refuerzo, "R-NaD". Para hacer DeepNash, Perolat y su equipo combinaron R-NaD con una arquitectura de red neuronal profunda para aprender una estrategia que juega a un nivel altamente competitivo. DeepNash fue probado contra varios bots de Stratego de última generación y jugadores humanos expertos. Ganó contra todos los bots y logró un nivel de juego altamente competitivo contra los jugadores expertos humanos de Stratego en Gravon, una plataforma de juegos en Internet y la mayor plataforma en línea de Stratego. En particular, de acuerdo con los autores, este rendimiento se logró sin desplegar ningún método de búsqueda, un ingrediente clave para muchos logros importantes de IA en juegos de mesa en el pasado.
Journal
Science
Article Title
Mastering the game of Stratego with model-free multiagent reinforcement learning
Article Publication Date
2-Dec-2022