OpenAI 发布 Procgen 基准,可直接测量强化学习智能体学习通用技能的速度
近日,OpenAI发布 Procgen Benchmark,该发布包括 16 种易于使用的程序生成环境,可直接测量强化学习智能体学习通用技能的速度。OpenAI 在其技术博客中称,所有 Procgen 环境都需要在 500-1000 个不同级别上进行训练,然后才能推广到新级别,这表明标准 RL 基准在每个环境中都需要更多的多样性。Procgen Benchmark 已成为 OpenAI RL 团队使用的标准研究平台,OpenAI 也希望该发布能促进社区创建更好的 RL 算法。