Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

机器之心编辑部发布

元宇宙时代,缺这样一颗「专用」芯片

AR 行业是否到了需要一颗专用芯片的拐点?近期,Rokid 与安谋科技联合造芯的消息,把这一话题抛到了行业聚光灯下。

引言

2017 年,就在苹果凭借 iPhone 和 Apple Watch 中的自研芯片斩获成功果实时,其 Mac 产品却在性能优化升级过程中遇到瓶颈。

自加入苹果后,芯片工程师斯鲁吉就一直致力于根据苹果设备的特定需求设计芯片,而不是使用满足通用要求的芯片。

当时,斯鲁吉启动了一项风险很大的项目:用自研的 M1 芯片取代苹果笔记本电脑和台式机 15 年来使用的英特尔处理器。

这一震惊 PC 行业的决定不仅使苹果跟其他竞争对手拉开巨大的领先优势,也为其进军汽车、VR 等潜在未来产品打下基础。

AR 行业即将开启专用芯片之路,是否会延续当年苹果的破局神话?

移动时代的通用芯片
无法撑起 AR 眼镜的未来

从手机的平面交互到 VR 的虚拟现实交互,再到 AR 的虚实融合交互,每一级的芯片算力需求都是指数级增长。

Meta 的 Oculus 主打 VR 场景,对芯片算力要求比手机高得多,但 VR 设备体积相对 AR 更大,对芯片功耗、体积的需求并不迫切。

微软的 Hololens 主打特定 AR 场景的使用,而不是日常佩戴,因此理论上只要在头部承重范围内,可以不断增加芯片以满足其功能需求。即使如此,在三代产品上,Hololens 也已牵手三星开始定制芯片。

2012 年采用棱镜方案的 Google Glass 曾做到 50g 的轻量级,但信息显示受限,屏幕成像效果不理想,也无法满足 C 端多样化的场景需求。

Rokid Air AR 眼镜。

2021 年,Rokid 推出了自重为 83g 的 AR 眼镜 Rokid Air,在轻量级上带领行业跨进了一大步。但距离一副日常佩戴的眼镜重量还有提升空间。

目前市面上 AR 眼镜的主流芯片方案;当前普遍的 “芯片拼搭模式” 不仅带来更大的 PCB 面积,还造成更高的功耗,更大的佩戴尺寸。

媲美一副墨镜的重量,提供极致的交互体验,以满足日常佩戴需求,相信这是 AR 眼镜未来的进化方向。但很明显,目前的通用型芯片在处理能力、功耗和性能上已满足不了未来便携型 AR 眼镜的发展需求。

PC 和移动时代的芯片已无法撑起面向未来的 AR 眼镜。

据调研机构预测,2025 年 AR 眼镜产品出货量将出现新高点。

面向未来 AR 眼镜的
全新异构芯片设计方案

随着元宇宙盛行,安谋科技作为中国最大的芯片设计 IP 开发和服务供应商之一,涉足元宇宙芯片并不意外。

据悉,Rokid 携手安谋科技要研发的专用芯片将采用高集成度、小封装、低功耗、低延迟、高性能的异构设计方案,提升影像和传感器数据质量,实现更好的 AR 体验。预期这颗 AR 芯片整体功耗在几百毫瓦,同时尺寸做到小拇指甲盖大小。

Rokid 将在 OS(YodaOS-XR)和算法引擎(SLAM、手势、数字人等)层面赋能,为面向未来的真正轻量、可以舒适佩戴的增强现实 AR 眼镜产品下注。
值得注意的是,这颗定制 AR 芯片不仅仅是把几个小芯片进行简单集成,而是通过芯片 pipeline 的低延迟设计,加速数据的读取、传输和处理,把所有数据快速传输到 Rokid Station 或手机上完成计算,以保证更好的实时性,比如 SLAM 要求更低的 MTP (motion to photon) 延迟。


勇闯 AR 造 “芯” 无人区
Rokid 底气何在?
“首先和最重要的是,如果我们这样做,我们能提供更好的产品吗?” 斯鲁吉在谈到苹果要造 M1 芯片的这场辩论时说,“这是首要问题。这和芯片无关。苹果不是一家芯片公司。”

相对于跨界进入芯片领域的厂商,AR 眼镜厂商公司推出自己的芯片则是一件更自然的事情。

小编注意到,早在 2018 年 Rokid 就发布了自研 AI 芯片 KAMINO18,这款芯片模组和 1 元硬币大小接近。当时通用的芯片都是用 CPU 做运算,但 Rokid 创造性选择用异构的方式来提升性能。

Rokid CEO Misa 在当时透露:“Rokid 不通过芯片赚钱,Rokid 也不是以做芯片为出发点的,因为对我们来讲,行业的人都知道芯片的利润特别低,只是因为市面上没有我们需要的,所以我们来做,如果市面上有我就用它。Rokid 不是一家芯片公司,而是人机交互技术公司,未来 Rokid 的芯片还会加入机器视觉方面的能力。”

2018 年,Rokid 选择集成 DSP 的 AI 芯片,在处理语音算法时实现数量级的提升;定制 NPU 完成深度学习神经网络的算法,比单纯用 CPU 来计算效率提高 30~50 倍。

时隔 4 年,这家还在成长中的创业公司要再一次在人机交互产品上创造 AR 芯片神话。

在 “拿来主义” 的捷径面前,Rokid 凭什么敢走自研芯片这条 “艰难且险峻之路”?

一是源于其产品迭代和场景落地的成熟经验。2021 年是元宇宙元年,但在 AR 细分领域,Rokid 已深耕了至少 5 年,拥有从硬件到软件,从技术底层到应用场景全覆盖的完备解决方案。

2017 年,Rokid 就已研制出 AR 眼镜原型机。

截止目前,Rokid 已有四款 AR 设备实现量产及规模化应用:红外测温眼镜 Rokid Glass、分体式阵列光波导 AR 眼镜 Rokid Glass 2、一体式工业 AR 头环 Rokid X-Craft、以及消费级 AR 眼镜 Rokid Air。囊括从单目到双目、从一体到分体、从工业级到消费级等多种设备形态,覆盖油气、电力、汽车、防疫、文旅展陈、零售、个体消费者等丰富场景。

这些经验的积累使得 Rokid 对 AR 产品的市场需求与发展趋势的研判都更为精准,能够为芯片设计提供更合理的方案。
二是 “自研芯片 + 自主 OS” 的紧耦合。芯片不能孤立进化,软硬一体的高度协同才能够使计算性能最大化。在此之前,Rokid 已自主开发了一套面向 AR 眼镜的操作系统 YodaOS-XR。

这是一个支持多模态交互、跨平台的操作系统。对 Rokid 来说,自己的芯片搭载自己的 OS 及软件生态,系统和算法的性能将发挥到最优,AR 眼镜的功耗与交互的延迟度能够进一步降低,带来更极致用户体验的同时,产品创新的自主权和想象空间也会无限大。


筑牢未来竞争壁垒
补齐生态最后一块拼图

从 2020 年开始,全球深陷 “缺芯潮” 危机,中国科技企业意识到在尖端且核心科技领域被 “卡脖子” 的滋味并不好受,车企、手机厂商、互联网大厂接二连三扎进 “造芯” 赛道。

方兴未艾的 AR 行业头上,也高悬着一把 “达摩克利斯之剑”。

站在元宇宙的窗口,Rokid 抢先踏上 AR 造芯的拓荒之路,用 “自研芯片 + OS” 打造产品护城河。一硬一软的自主研发,成为掌握科技竞争主动权的核心倚仗。

当然,目前 XR 领域的竞争将愈演愈烈,互联网和手机巨头们虽未正式入局,但不排除全面入局的可能性。

Rokid 作为行业先行者,并没有逃避这个问题,而是早早在 “生态版图” 上布下先手棋。

这款自研芯片在 Rokid 的版图中,可能意味着生态链的最后一环,也是最关键一环。至此,Rokid 将形成 “芯片 + 操作系统 + 算法引擎 + 平台 + 硬件” 的完整生态,进一步筑牢产品竞争壁垒。

站在行业角度,这颗芯片作为 AR 造芯的开端,将为后续 AR 芯片的迭代与升级积淀下宝贵经验。Rokid 对 AR 产品、技术、用户、市场的理解以及对整个行业和生态的理解也将通过这颗芯片的落地输送给合作伙伴。

随着 Rokid 与安谋科技的 “芯” 动作,元宇宙行业是否将站上加速期?我们拭目以待。
产业芯片AR眼镜
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

增强现实技术

增强现实,是指透过摄影机影像的位置及角度精算并加上图像分析技术,让屏幕上的虚拟世界能够与现实世界场景进行结合与互动的技术。这种技术于1990年提出。随着随身电子产品运算能力的提升,增强现实的用途也越来越广。

虚拟现实技术

虚拟现实,简称虚拟技术,也称虚拟环境,是利用电脑模拟产生一个三维空间的虚拟世界,提供用户关于视觉等感官的模拟,让用户感觉仿佛身历其境,可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时,电脑可以立即进行复杂的运算,将精确的三维世界视频传回产生临场感。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

机器视觉技术

机器视觉(Machine Vision,MV)是一种为自动化检测、过程控制和机器人导航等应用提供基于图像的自动检测和分析的技术和方法,通常用于工业领域。

推荐文章
暂无评论
暂无评论~