DeepMind 联合国际象棋世界冠军探索国际象棋中的替代规则集
近日,来自 DeepMind 的研究团队联合 2000-2007 年世界国际象棋冠军发表了一篇名为「使用 AlphaZero 评估游戏平衡:探索国际象棋中的替代规则集」的新研究。以下是该研究的完整摘要分享:设计引人入胜且平衡的游戏规则集并非易事。现代国际象棋已经发展了多个世纪,但是由于没有类似的历史依据,规则变化对游戏动态的影响很难预测。AlphaZero 提供了另一种计算机模拟的游戏平衡评估方法。通过不断地从自身经验中学习,该系统可以从头开始为任何规则集学习近乎最优的策略,而无需任何人工监督。在这项研究中,研究团队使用 AlphaZero 创造性地探索和设计新的国际象棋变体。由于经典国际象棋的开局理论丰富,职业比赛的抽奖比例高以及在两名球员仍在准备比赛时结束的比赛数量不容小视,因此像 Fischer Random Chess 这样的国际象棋变型形式引起了越来越多的兴趣。研究团队比较了涉及国际象棋规则的原子变化的其他九种变体。这些变化允许出现新颖的战略和战术模式,同时使游戏与原始游戏保持接近。通过使用 AlphaZero 学习每种变体的接近最佳策略,研究人员可以确定如果采用这些变体,则在强大的人类玩家之间的游戏方式会是什么样。定性地,几个变体是非常动态的。一项分析比较表明,不同变体之间的棋子价值不同,而且某些变体比经典国际象棋更具决定性。研究发现证明了现代国际象棋规则以外的丰富可能性。