News Release

AI终于掌握了Stratego博弈

Summary author: Meagan Phelan

Peer-Reviewed Publication

American Association for the Advancement of Science (AAAS)

据研究人员报告,一种新开发的名为“DeepNash”的人工智能代理学会了具人类专家水平的Stratego博弈;Stratego是AI还未掌握的少数棋盘游戏之一。这项研究的作者说,它代表了一个“非同寻常的结果,因为Stratego圈内人士认为,这是用现有的技术不可能做到的。”多年来,棋盘游戏Stratego一直是AI研究的下一个前沿领域之一;该游戏所测试的是一个人依次做出相对缓慢、审慎和逻辑决策的能力。作为一种“不完美的”信息游戏(即游戏中的某些玩法是向对手隐瞒的),Stratego给AI研究人员带来了重大挑战,因为它的结构有许多复杂的方方面面,其中包括它比另一经过充分研究的不完美信息游戏(即无限制德州扑克)拥有更多可能的状态。目前,人们不可能用不完美信息搜索技术来掌握Stratego。Julien Perolat和同事在此介绍了一种新的方法,它能让AI来学习该游戏。这种新方法产生了一中名为DeepNash的机器人,它能在该游戏的最复杂变体“Stratego Classic”中展示人类的专家级表现。DeepNash的核心是一种强化学习算法“R-NaD”。为制作DeepNash, Perolat和团队将R-NaD与深度神经网络架构结合,旨在学习在高度竞争层面进行博弈的策略。DeepNash与各种最先进的Stratego机器人和专家级人类玩家进行了博弈测试。它战胜了其它所有的机器人,并在Gravon(一个互联网游戏平台,也是Stratego的最大在线平台)上与Stratego的专家级人类玩家进行了极具竞争性的对弈。作者说,值得注意的是,这种博弈水平是在没有使用任何搜索方法的情况下做到的,而搜索方法是过去各种桌游中许多具里程碑意义AI成就的关键组分。


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.