通过游戏学习潜在计划 谷歌新论文扩展机器人技能学习
谷歌研究人员提出新研究话题,以下为论文概述:我们提出学习远程操作的游戏数据,作为扩展多任务机器人技能学习的一种方法。从游戏中学习(LfP)提供三个主要优点:1)便宜。由于不需要场景分段,任务分段或重置为初始状态,因此可以快速收集大量的播放数据。2)通用。它包含功能和非功能行为,放低了对预定义任务分发的需求。3)丰富。游戏涉及重复的,变化的行为,并且自然地导致可能的交互空间的高度覆盖。这些属性将游戏与专家演示区分开来,后者既丰富又昂贵,而且脚本无人值守的数据收集虽然便宜但不够丰富。然而,游戏中的多样性对于寻求在顶部学习控制的方法提出了多模式挑战。