Soft Actor-Critic - 真实世界机器人深度强化学习
加州伯克利大学发布了其最先进的非策略无模型强化学习算法,soft actor-critic(SAC)。该算法由加州大学伯克利分校和谷歌大脑联合开发,研究员一直在内部使用它进行机器人实验。据悉,SAC 是当今最有效的无模型算法之一,使其特别适合现实世界的机器人学习。在这篇文章中,研究员将针对最先进的无模型强化学习算法对 SAC 进行基准测试,并展示一系列真实世界的机器人示例,从操作到运动。研究员还发布了 SAC 的实施,这是专门为现实世界的机器人系统设计的。