伯克利星际争霸II AI「撞车」腾讯,作者:我们不一样
近日,来自加州大学伯克利分校的研究者发表论文《Modular Architecture for StarCraft II with Deep Reinforcement Learning》,在星际争霸 II 中使用了一种新型模块化 AI 架构,该架构可以将决策任务分到多个独立的模块中。在虫族对虫族比赛中对抗 Harder(level 5)难度的暴雪 bot,该架构达到了 94%(有战争迷雾)和 87%(无战争迷雾)的胜率。
据悉,该项研究与腾讯、罗切斯特大学和西北大学的联合研究《TStarBots: Defeating the Cheating Level Builtin AI in StarCraft II in the Full Game》同时期开展,他们也提出了分层、模块化架构,并手工设计了宏指令动作。Berkeley 的研究者解释道,二者不同之处在于,该项研究中的智能体是在模块化架构下仅通过自我对抗及与几个脚本智能体对抗来训练的,直到评估阶段才见到内建 bot。