李飞飞团队新作:级联变分推理的多步操纵动力学学习
近日,包括李飞飞在内的来自斯坦福大学,英伟达以及多伦多大学 Vector Institute 的研究团队发表了一篇名为「级联变分推理的多步操纵动力学学习」的新研究。该团队将级联变异推理(CAVIN)引入在学习的潜在空间中分层生成计划。其机器人学会了在不同任务中与多个对象进行战略性交互。以下是该研究的完整摘要分享:规划多步操作的根本挑战是找到导致任务目标的有效且合理的动作序列。研究团队介绍了 CAVIN 计划程序,这是一种基于模型的方法,可以通过从潜在空间进行采样来分层生成计划。为了便于长时间规划,该方法学习了潜在的表示形式,这些表示形式通过级联的变分推理将高级效果的预测与低级运动的生成解耦。这使研究人员能够在两个不同的时间分辨率级别上对动力学进行建模,以进行层次规划。鉴于高维观测,研究团队在杂乱的桌面环境中的三个多步机器人操作任务中评估了该方法。实验结果表明,通过与多个对象进行战略性交互,该方法优于基于模型的最新方法。点击下方链接阅读完整论文。项目网站链接:stanford.io/2ps68Ia