伯克利发表 rlpyt:PyTorch 中用于深度强化学习的研究代码库
今天,加州伯克利大学介绍了他们的最新研究成果:rlpyt,它使用领先的深度学习库 Pytorch 包含 Python 中许多常见的深度 RL 算法的模块化实现。在众多现有实现中,rlpyt 是研究人员使用的更为全面的开源资源。
rlpyt 被设计为高通量代码库,用于深度 RL 的中小型研究(大规模是 DeepMind AlphaStar 或 OpenAI Five,具有 100 个 GPU)。rlpyt 从「分布式强化学习中的循环体验重播」(R2D2)中复制了 Atari 域最近的创纪录的结果-除非不需要分布式计算基础结构来收集所需的十亿帧游戏框架。研究员还介绍了一种名为 namedarraytuple 的新数据结构,该结构在 rlpyt 中广泛用于处理 numpy 数组的集合。
链接:https://github.com/astooke/rlpyt