斯坦福大学 AI 研究人员推出动态环境下的强化学习 LILAC
斯坦福大学 AI 实验室(SAIL)的研究人员设计了一种方法,可以处理随时间变化的数据和环境,其性能优于某些强化学习的领先方法。Lifelong Latent Actor-Critic(也称为 LILAC)使用潜在变量模型和最大熵策略来利用过去的经验来在动态环境中提高采样效率和性能。该团队在论文中写道:“在各种具有非平稳性的具有挑战性的连续控制任务上,我们观察到,与最新的强化学习方法相比,我们的方法可以带来实质性的改进。” (Venture Beat)