Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

天啊,人形机器人又双叒叕进化了

机器之能报道

编辑:Sia

看起来莫拉维克的悖论可能是错误的?

才两个月时间,特斯拉 Optimus 又进化了。

最新视频里,Optimus 步速已达每秒 0.6 米,虽然只是健康成年人步速的一半,但和去年 12 月的视频相比,速度已经提升了 30% 以上。

视频链接:https://mp.weixin.qq.com/s/Ny0GATWx7cL9hNV1DqHhzA

Optimus 每天都在生产它的工厂里转悠,步伐更稳定,也显得更自信(转弯时也是如此)。另外,还增加了轻微的躯干和手臂摇摆。为此,团队不仅改进了模拟人类的前庭系统(一个维持人体平衡的重要感受器,位于我们内耳),还优化了足端轨迹和与地面接触的逻辑,升级了动作规划器并降低了从输入到输出所需的时间周期。

这是去年 5 月、 12 月到今年 2 月 Optimus 走路动作的对比视频,速度和姿态的进化肉眼可见。


Optimus 进化了,还是免不了网友一波恶搞,这转悠的步速是不是颇有拜登风范?

前不久,另一家颇受关注的人形机器人公司 1X 也发布了最新视频。过去一年里,他们构建了一个数据引擎,用于以完全端到端的方式解决通用的移动操作任务。最新视频展示了 EVE 在这一技术路径下掌握的新技能。

这是从事物流场景下的例行工作,将货架上的包裹放到传送带上、选取物品放到盒子,自由行走、出入不同房间。

家庭场景的技能,收拾地面物品。

EVE 还能给自己充电,自己插入、拔掉插头。

每一个行为都是由一个 10Hz 频率的视觉神经网络控制,它主要控制机器人们的前进、手臂、躯干和头部。为了证明这个近三分钟的新视频没有猫腻(没有远程遥控、没有 CGI 特效、并非脚本重放),他们采用了一镜到底的拍摄方式。

一镜到底的完整视频

家庭和办公环境具有挑战性,因为它们是非结构化的且不断变化的。机器人不能对身体以外的世界做出太多假设,所以 1X 追求最通用的自主性方法。

他们在 30 台 EVE 中组装了一个高质量、多样化的演示数据集,利用这些数据训练一个“基础模型”,这个基础模型可以理解一系列人类活动和技能——从清洁到整理房屋、从捡起物体到与人类和其他机器人互动。

接下来,他们微调这个基础模型,以获取实现更加具体功能的模型。比如,一般门操作的模型和另一个用于仓库任务的模型,并进一步微调这些模型以解决特定任务,比如打开这扇特定的门。

基于这一策略,EVE 掌握新技能仅需短短几分钟的数据收集和基于桌面 GPU 的训练。更重要的是,训练 EVE 不用写代码而仅需要数据。这意味着没有 AI 工程师的普通客户也能训练人形机器人新技能。

图片

1X AI 团队负责人也点赞了特斯拉的最新进展。

据 1X CEO Bernt Bornich 透露,接下来四周 EVE 将持续进化,学会整理办公室并在 EVE、NEO 人形机器人生产线上从事物流相关工作。所有这些都会使用与视频中一样的数据收集和训练流程。

现在, EVE 已经部署到了一些大型企业中。人形机器人 Digit 正在亚马逊研发仓库接受测试,全球最大的纯合同物流供应商 GXO Logistics 也在测试 Digit,工作内容也差不多——与自主移动机器人 (AMR) 打配合,运输装送包裹和物品的周转箱。

英伟达、OpenAI 和贝索斯都有投资的人形机器人公司 Figure AI 已宣布与宝马合作,将机器人引入汽车制造领域,但至今尚未透露任何具体进展。在国内,优必选工业版人形机器人 Walker S 已经进入蔚来汽车第二先进制造基地总装车间,接受实地“培训”,在汽车工作流水线上与人类协作完成装配、质检作业。

工业版人形机器人 Walker S,身高 1.7 米,可替换末端执行器,搭载了 41 个高性能伺服关节以及多维力觉、多目立体视觉、全向听觉和惯性、测距等全方位的感知系统,拥有全面升级的视觉定位导航、手眼协调操作、步态控制、多模态路径规划垂域模型等技术,机器人的自主运动及决策能力大幅提高,可在工厂流水线实现精准安全同步的作业。

除了既有玩家,就在身家暴涨、突破 2 万亿美元当口,英伟达也宣布成立通用具身智能体研究实验室 GEAR( Generalist Embodied Agent Research ,意为“通用具身智能体研究”),入局具身 AI。

图片

“我们相信,在未来,每一台移动的机器都将是自主的,机器人和模拟代理将像 iphone 一样无处不在。”英伟达 AI 科学家 Jim Fan 在 X 上表示,他同时也是该实验室的联合创始人,“我们正在打造基础智能体:一个具备通用能力的 AI,其能在虚拟与现实的多个世界中学习如何熟练行动。2024 年将是机器人之年、游戏 AI 之年、模拟之年。”

他还补充了一条 X 说:我们团队可能是全球最有钱的具身智能实验室。

参考链接

https://www.therobotreport.com/agility-robotics-jonathan-hurst-to-discuss-humnaoids-robotics-summit-keynote/
https://twitter.com/home?lang=zh
https://www.1x.tech/discover/all-neural-networks-all-autonomous-all-1x-speed

产业
相关数据
感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

路径规划技术

路径规划是运动规划的主要研究内容之一。运动规划由路径规划和轨迹规划组成,连接起点位置和终点位置的序列点或曲线被称为路径,构成路径的策略则被称为路径规划。路径规划在很多领域都具有广泛的应用,如机器人的自主无碰行动;无人机的避障突防飞行等。

移动机器人技术

移动机器人是一种能够移动的自动机器。移动机器人具有在其环境中移动的能力,并且不固定到一个物理位置。移动机器人可以“自动”主要是指它们能够在没有物理或机电引导装置的情况下导航非受控环境。相比之下,传统的工业机器人或多或少都是固定的(stationary)机械臂或抓取组件。

宝马机构

宝马(BMW)是享誉世界的豪华汽车品牌。宝马的车系有1、2、3、4、5、6、7、8、i、X、Z等几个系列,还有在各系基础上进行改进的M系(宝马官方的高性能改装部门)。 宝马公司创建于1916年,总部设在德国巴伐利亚州慕尼黑。BMW的蓝白标志宝马总部所在地巴伐利亚州州旗的颜色。百年来,宝马汽车由最初的一家飞机引擎生产厂发展成为以高级轿车为主导,并生产享誉全球的飞机引擎、越野车和摩托车的企业集团,名列世界汽车公司前列。其全称为Bavarian Motor Work。 2018年7月10日,长城公司与宝马公司签署合资协议,合资成立光束汽车有限公司。2018年10月11日,宝马集团举行了中国战略协议签字仪式和华晨宝马铁西新工厂开工仪式。宝马对华晨宝马投资新增30亿欧元,合资协议延至2040年。 2018年12月18日,世界品牌实验室编制的《2018世界品牌500强》揭晓,宝马排名第16位。

www.bmwgroup.com
相关技术
蔚来汽车机构

蔚来是立足全球的智能电动汽车公司,由知名科技企业和企业家于2014年创立。蔚来致力于通过提供高性能的智能电动汽车与用户体验,为用户创造愉悦的生活方式,打造全球范围内的用户企业。

官网,https://www.nio.com
推荐文章
暂无评论
暂无评论~