DeepMind 新论文引关注:具有工作记忆和情景记忆的强化学习者泛化
近日,DeepMind 发表了一篇名为「具有工作记忆和情景记忆的强化学习者泛化」的新论文,并在社交媒体上引发了广泛的关注。以下是该论文的完整摘要分享:记忆是智力的重要方面,并在许多深度强化学习模型中发挥作用。但是,在了解特定的存储系统何时比其他系统更有用以及它们的概括性如何方面进展甚微。该领域还没有一种普遍的,一致且严格的方法来评估智能体对保留数据的性能。在本文中,研究人员旨在开发一种全面的方法来测试智能体中不同种类的记忆,并评估智能体如何将其在训练中所学的知识应用到与研究团队建议的相关维度不同的训练集上来评估特定于存储器的泛化。为此,研究团队首先构造一个多样化的存储任务,来评估多个维度测试时间泛化。其次,研究人员在结合了多个内存系统的代理架构上开发并执行多种消融,观察其基准模型,并针对任务套件调查其性能。点击链接阅读原文。