基础模型 (Foundation Models) 已经在过去几年里重塑了自然语言处理 (NLP) 和计算机视觉 (CV) 研究的格局,那么基础模型能为机器人带来怎样的可能性?这篇综述或许有你想要的答案。
机器人的主要组件可分为感知、决策和规划、动作生成三大部分。该团队将机器人感知分为被动感知、主动感知和状态估计。 在机器人决策和规划部分,研究者分经典规划方法和基于学习的规划方法进行了介绍。 机器的动作生成也有经典控制方法和基于学习的控制方法。
如何为机器人具身设定标准基础(grounding)? 安全(Safety)和不确定性(Uncertainty)? 端到端方法(end-to-end)和模块化(Modular)方法是否无法兼容? 对具身的物理变化的适应能力 世界模型(World Model)方法还是与模型无关的方法? 新型机器人平台和多感官信息 持续学习(Continue Learning) 标准化和可复现能力(Reproducibility)