Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Figure AI把「终结者」造出来了

能语音对话,VLM 视觉,每天工作 20 小时。


总会有这一天,但我们没想到来的居然这么快。

北京时间 8 月 6 日晚,硅谷著名具身智能创业公司 Figure 正式发布了自己的新一代人形机器人 Figure 02。

图片

图片

除了样子够科幻,这种机器人也有着足够通用的智能,它可以与人类实时对话,自动学习如何装配零件。事实上,Figure 02 正在宝马位于 Spartanburg 的工厂实习工作,我们仿佛已经进入了未来。

图片

Figure 工程和设计团队完成了对 Figure 02 硬件和软件的彻底重新设计。在人工智能、视觉、电池、电子设备、传感器和执行器等关键技术上均取得了重大进步。
具体来说,Figure 02 主要包括以下特点:

  • 实时语音对话:Figure 02 能够通过连接到定制 OpenAI 大模型的内置麦克风和扬声器与人对话;
  • 摄像头:由 6 个 RGB 摄像头驱动的 AI 视觉系统;
  • 机械手:具有 16 个自由度和与人类同等力量的第四代机械手;
  • 内置 VLM:支持机器人摄像头进行快速常识性视觉推理
  • 大容量电池:机器人躯干中的 2.25 KWh 定制电池组可提供 50% 以上的电量;
  • CPU/GPU:与上一代相比,机载计算和 AI 推理能力提高了 3 倍。

全面改进:通用 + 人形 + 实用化

这回升级,最大的变化可能是 Figure 02 真的准备好回应语音指令了。

去年那支惊艳科技圈 demo 里,站在 Figure 01 前的人类向这位机器人提问:「可以拿点东西给我吃吗?」它不仅识别出面前的物体是苹果,它更懂得苹果可以直接食用,于是它把苹果递给了面前的人,说道:「当然,拿去吃吧。」

今年 3 月,OpenAI 宣布与 Figure 合作开发具身智能,让人形机器人拥有了实时有效的对话能力。背靠 OpenAI,Figure 能够快速迭代机器人语音到语音的能力。Figure 表示,由于 Figure 02 的端侧算力大幅提升,已经可以完全自主地在现实世界中执行各种任务。

在 Figure 02 上,机器人语音推理的实现主要得益于内置的麦克风和扬声器连接到与 OpenAI 合作训练的定制 AI 模型上。

图片

Figure 02 的导航系统使用了 VLM(视觉语言模型),这使得机器人上的摄像头能够进行语义基础研究和快速常识性视觉推理。VLM 是当前众多造车新势力正在研究的智能驾驶新方向,在机器人领域,这种方法显然也可以在很多任务上实现突破性的效果。

图片

续航能力可以说是人形机器人实用化面临的最大挑战之一。Figure 02 机器人躯干内定制有容量为 2.25 KWh 的电池组,可以比 Figure 01 多提供 50% 以上的能量,从而最大程度地延长机器人的运行时间。Figure AI 的创始人、CEO Brett Adcock 表示,他们希望 Figure 02 每天能够实现约 20 小时以上的有效工作。

图片

我们可以看到,Figure 02 的外观变得更加具有整体性,这是因为它采用了全新的外骨骼结构。相比于 Figure 01,机器人的外形设计转变较为彻底。另外它也采用了集成布线的设计。集成布线具有以下好处:

  • 可靠性更高
  • 隐藏电线 
  • 更紧密的封装 

图片

                             从 Figure 01 到 Figure 02,外形上有很大改观。

除了更好的布线,Figure 02 还设计了定制的电线端子和连接器,以提高机器人的可靠性。

图片

为了能像人类一样理解世界,Figure 02 通过多摄像头 + AI 驱动的视觉系统来进行感知与推理。其在头部、前躯干和后躯干共有 6 个板载 RGB 摄像头,使得机器人具有超越人类的视觉能力。

图片

最后还有灵巧的手指。Figure 02 搭载了第四代机械手,有 16 个自由度,并具有与人类相当的力量,可以胜任各种复杂任务,整个手包含了机械、电气、控制和传感器等技术。

图片

Brett Adcock 表示,随着机器人的不断运行,AI 数据引擎将收集并整理数据用于训练模型,不断提升性能。

图片

看到 Figure 02 这么精彩的亮相,让人不禁想起了马斯克家的擎天柱,两者相比,不知道谁更胜一筹。

图片

还有网友表示「Figure 02 预示着一个新时代的开始,这是目前世界上最先进的机器人,未来已来。」
图片
创业公司 Figure:半个硅谷都在投

Figure 由 Brett Adcock 于 2022 年创立,是一家总部位于美国的机器人公司,专门开发人形机器人。该公司的目标是开发通用人形机器人,为人类带来积极影响,为后代创造更美好的生活。

在生成式 AI 技术爆发后,很多以具身智能为目标的机器人公司不断出现,而 Figure 在其中显得尤为亮眼。2023 年 3 月,Figure 走出隐身模式,推出了原型机器人 Figure 01,其外观和动作都与人类相似。这是一款专为体力劳动设计的双足机器人,最初针对的是物流和仓储行业。

2023 年 5 月,该公司从 Parkway Venture Capital 领投的投资者手中筹集了 7000 万美元。

同年 10 月,Figure 放出 Figure 01 双足机器人行走视频。

图片

很快到了今年 1 月,Figure 01 已经学会了煮咖啡。

图片

2024 年 1 月 18 日,Figure 宣布与宝马合作,在汽车制造工厂部署人形机器人。此时的 Figure 01 号称已经可以自主完成现实世界中的任务了。

图片

                           Figure 01 在宝马工厂里工作。

今年 3 月,Figure 宣布完成惊人的 6.75 亿美元 B 轮融资,公司估值达到 26 亿美元。投资者包括微软、英特尔、OpenAI Startup Fund、Amazon Industrial Innovation Fund 、英伟达、贝索斯、「木头姐」的方舟投资、Parkway Venture Capital、Align Ventures 等。

与此同时,Figure 还宣布与 OpenAI 建立合作伙伴关系,包括 OpenAI 为 Figure 的人形机器人构建专门的 AI 模型,使其机器人能够处理和推理语言。

3 月 13 日,借助 OpenAI 技术,Figure 01 可以与人类进行全面对话。
从直立行走,完成复杂任务到与人自然交互。这些技术亮点也是 Figure 和一直希望回归机器人领域的 OpenAI 达成合作协议的重要原因之一 —— 将 OpenAI 的研究与 Figure 的机器人经验结合起来,为人形机器人开发下一代 AI 模型。

在今天 Figure 02 发布后,高度集成的硬件与 VLM 等新一代 AI 技术结合,让我们距离真正具有通用能力的人形机器人更近了一步。

很快,物理世界也要迎来 AI 带来的变革了?

参考内容:
https://x.com/Figure_robot/status/1820791819023909031
https://www.youtube.com/watch?v=0SRVJaOg9Co
https://www.therobotreport.com/figure-02-humanoid-robot-is-ready-to-get-to-work/
产业Figure 02Figure
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

宝马机构

宝马(BMW)是享誉世界的豪华汽车品牌。宝马的车系有1、2、3、4、5、6、7、8、i、X、Z等几个系列,还有在各系基础上进行改进的M系(宝马官方的高性能改装部门)。 宝马公司创建于1916年,总部设在德国巴伐利亚州慕尼黑。BMW的蓝白标志宝马总部所在地巴伐利亚州州旗的颜色。百年来,宝马汽车由最初的一家飞机引擎生产厂发展成为以高级轿车为主导,并生产享誉全球的飞机引擎、越野车和摩托车的企业集团,名列世界汽车公司前列。其全称为Bavarian Motor Work。 2018年7月10日,长城公司与宝马公司签署合资协议,合资成立光束汽车有限公司。2018年10月11日,宝马集团举行了中国战略协议签字仪式和华晨宝马铁西新工厂开工仪式。宝马对华晨宝马投资新增30亿欧元,合资协议延至2040年。 2018年12月18日,世界品牌实验室编制的《2018世界品牌500强》揭晓,宝马排名第16位。

www.bmwgroup.com
相关技术
视觉推理技术

视觉推理是指为了得出某个结论而操纵一个人对一个物体的心理印象的过程。

推荐文章
暂无评论
暂无评论~