DeepMind「自然」新文介绍 AlphaZro「继任」MuZero,无规则条件下掌握围棋,象棋,将棋和Atari
2016 年,DeepMind 推出 AlphaGo,这是第一个在围棋中击败人类的人工智能(AI)程序。两年后,它的继任者 - AlphaZero - 从零开始学习围棋,国际象棋和将棋。现在,在《自然》杂志的一篇论文中,DeepMind 详述 MuZero,这是在追求通用算法方面迈出的重要一步。由于 MuZero 能够在未知环境中计划获胜策略,因此无需掌握规则即可掌握围棋棋,将棋和 Atari 的知识。(DeepMind)