Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

首款生成式AI移动芯片天玑9300:能跑330亿参数大模型

AI 画图一秒生成,大语言模型一秒 20 token。

2023 年是生成式 AI 的元年,我们手上的移动设备也在加速进入大模型时代。

11 月 6 日晚,联发科(MediaTek)正式发布了年度旗舰 SoC 天玑 9300,这款芯片通过 4+4 全大核的设计,在性能与能耗等方面,全面超越了安卓和苹果竞品。

更为值得关注的是,今年的旗舰芯片被定义为 5G 生成式 AI 移动芯片,提供了远超以往的高智能、高性能、高能效、低功耗卓越特性。

图片

天玑 9300 采用台积电新一代 4nm 工艺,拥有 227 亿个晶体管。为了提供生成式 AI 时代的算力需求,天玑 9300 上开创性地使用了「全大核」CPU 架构,包含 4 个 Cortex-X4 超大核,最高频率可达 3.25GHz,以及 4 个主频为 2.0GHz 的 Cortex-A720 大核,其峰值性能相较上一代提升 40%,同性能情况下功耗节省 33%。

图片

这种架构在保证了工作速度快、效率高的同时具有省电的特性,无论在轻载还是重载应用场景中,都能降低功耗、延长续航时间。联发科表示,天玑 9300 面向目前常用的视频、直播、游戏等常见任务需求进行了优化,相比以往也更加适应折叠屏手机的多任务模式。

随着芯片制程提升,晶体管正在不断小型化,各种漏电问题成为摩尔定律发展的重大障碍。漏电意味着能量消耗的大幅增加,芯片也会面临过热甚至失效的问题。在这种情况下,小核心的功耗与大核心差距已越来越小。

据介绍,早在三年前联发科就开始了全大核芯片形式的探索。现在,让大核快速处理任务后进行较长时间的休眠,我们可以让大核处理器反直觉地相比小核同类产品更加省电。另一方面,联发科也加入了乱序执行(out-of-order)策略,进一步增加了应用执行的效率。图片联发科认为到明年,全大核的设计将成为业内的共识。

常规能力之外,联发科本次着重升级了芯片的 AI 性能。天玑 9300 集成了 MediaTek 第七代 AI 处理器 APU 790,专为生成式 AI 而设计,其性能和能效相较上一代得到显著提升,整数运算和浮点运算的性能是前一代的两倍,功耗降低了 45%。

图片APU 790 内置了硬件级的生成式 AI 引擎,可实现更加高速且安全的边缘 AI 计算,相比上代,它专门针对目前大语言模型常用的 Transformer 进行算子加速,大模型的处理速度是上一代的 8 倍。

当代流行的大语言模型(LLM),其主要核心网络架构大多是由 transformer Block 组成的。相较于计算机视觉常见的 CNN 网络,transformer 网络以 Softmax+LayerNorm 算子作为核心,卷积算子较少,因此原先 AI 核心的加速机制并不适用。在第七代 APU 处理器上,联发科着重优化 Softmax+LayerNorm 算子,提升了算力。

量化是目前优化 AI 推理的有效方式之一。基于亿级参数语言模型特性,联发科开发了混合精度 INT4 量化技术,结合其特有的内存硬件压缩技术 NeuroPilot Compression,可以更高效地利用内存带宽,大幅减少 AI 大模型对终端内存的占用。

联发科的工程师表示,虽然大模型可以带来更好的生产力,但本地运行 13B 的体量就意味着需要占用约 13GB 的内存,再加上安卓本身的 4GB,其他 APP 的 6GB,已经超过了大多数手机 16G 的内存容量。天玑 9300 使用的内存硬件压缩技术,通过量化和压缩把大模型的内存占用降低到了 5GB,只有这样才能让大多数用户在日常跑得起大模型应用。

APU 790 还支持生成式 AI 模型端侧「技能扩充」技术 NeuroPilot Fusion,可以基于基础大模型持续在端侧进行低秩自适应(LoRA,Low-Rank Adaptation)融合,进而赋予基础大模型更加全面的能力。 

基于这样的硬件和优化,天玑 9300 在苏黎世联邦理工提出的 AI Benchmark 最新版本上可以达到 2019 分,是移动芯片的新高。

图片

使用天玑 9300,端侧的 AI 图片生成如 Stable Diffusion 可以做到一秒以内出图,70 亿参数语言模型的端侧推理可以做到每秒 20token。

联发科表示在与 vivo 的合作中,基于天玑 9300 已经率先实现了 7B 和 13B 大模型在移动端的推理,预计不久之后在终端就可以看到这样的产品推向市场。另外在更极限的情况下,联发科还跑通了高达 33B 的大模型。

在发布之前的沟通会和现场,联发科展示了使用天玑 9300 工程机实现的 LoRA 文生图、大模型生成文字等能力。

我们可以预见,在最新一代旗舰手机上,我们可以用上更聪明的智能助手,根据大模型给出的建议快速回复聊天和右键,用 AI 生成的表情包斗图……

图片

马上就会推出且人人都可以体验到的,就是 vivo X100 系列手机上 OriginOS 4 系统里的 AI 助理蓝心小 V。

图片

本月初,vivo 刚在开发者大会上介绍了蓝心大模型及其应用,这一系列能力显然是面向手机的。在大模型的加持下,蓝心小 V 拥有行业领先的智慧,它可以通过语音、文字、文件拖拽等方式接收信息进行处理。如果遇到简单的问题,小 V 会以文字或图片进行回复。面对复杂的问题,它还可以通过 SWOT 模型或思维导图的形式输出回答。

此外,天玑 9300 的 AI 能力还覆盖从搜索到拍摄。

图片

联发科表示,其 AI 开发平台 NeuroPilot 已经对安卓、LIama 2、文心一言、百川大模型等前沿主流 AI 大模型进行了深度适配和优化,更多应用也在路上。

图片

GPU 方面,天玑 9300 采用了 12 核心的 Immortalis-G720。与上代相比峰值性能提升 46%,相同性能下功耗可节省 40%。天玑 9300 搭载 MediaTek 第二代硬件光线追踪引擎,支持 60FPS 高流畅度的光线追踪,并带来游戏主机级的全局光照特效。

图片

此外,MediaTek 特有的 MAGT 游戏自适应调控技术升级为「星速引擎」,不仅与游戏应用广泛合作,还将拓展更多类型应用的生态合作。在活动中,联发科宣布天玑 9300 平台将首发《仙剑世界》光追版,同时也将在手游《暗区突围》上实现稳定 60 帧光追的体验。

目前根据很多第三方评测,天玑 9300 工程机的 CPU、GPU 绝对性能和功耗比均超过了骁龙 8Gen3 与 A17Pro,看起来使用全大核的策略是成功的。

图片                                图片来源:极客湾 Geekerwan

在其他方面,天玑 9300 也进行了全面升级,其 ISP 升级到了 Imagiq 990,支持 AI 语意分割视频引擎、16 层图像语意分割、景深和光斑双引擎、全像素对焦叠加 2 倍无损变焦、OIS 光学防抖专核、3 麦克风高动态录音降噪,可过滤 25km/h 风速的 99% 以上风噪。

天玑 9300 还配备了新的安全启动芯片、隔离的安全计算环境和 Armv9 的内存标记扩展,可帮助开发人员避免内存漏洞利用。

网络方面,天玑 9300 集成了 5G 调制解调器支持 Sub-6GHz 四载波聚合(4CC-CA)和多制式双卡双通,也通过 AI 算法提升信号,支持 5G 情境感知功能。天玑 9300 支持 Wi-Fi 7 和 5G sub-6GHz 频段,下行链路速率达到 7Gbps。在蓝牙连接方面,天玑 9300 支持 3 个蓝牙天线、特有双路蓝牙闪连技术,可以带来超低时延的蓝牙音频体验。

图片

据介绍,首款采用天玑 9300 芯片的手机包含 vivo、OPPO、小米、传音等。在联发科的发布活动后,vivo 已宣布即将在 11 月 13 日发布的 X100 系列中率先搭载新旗舰芯片,并第一个实现 LPDDR5T-9600 内存的落地。

图片

我们期待新一代产品的问世。

产业APU 790天玑 9300联发科
相关数据
感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

光线追踪技术

在计算机图形学中,光线跟踪是一种渲染技术,用于通过将光的路径跟踪为图像平面中的像素并模拟虚拟对象对光线的接收效果来生成图像。 该技术能够产生非常高的视觉真实感,通常高于典型扫描线渲染方法,但计算成本更高。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

摩尔定律技术

摩尔定律是由英特尔创始人之一戈登·摩尔提出来的。其内容为:积体电路上可容纳的电晶体数目,约每隔两年便会增加一倍;经常被引用的“18个月”,是由英特尔首席执行官大卫·豪斯所说:预计18个月会将芯片的性能提高一倍。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

台积电机构

台积电(中国)有限公司成立于台湾新竹科学园区,并开创了专业集成电路制造服务商业模式。台积公司专注生产由客户所设计的芯片,本身并不设计、生产或销售自有品牌产品,确保不与客户直接竞争。公司为客户生产的晶片被广泛地运用在电脑产品、通讯产品、消费性、工业用及标准类半导体等多样电子产品应用领域。

https://www.tsmc.com/schinese/default.ht…
联发科机构

联发科软件(上海)有限公司是一家专注于混合信号系统芯片(Mixed Signal System)技术研发的国际化高科技公司。产品覆盖液晶显示器、电视、手机、RFID、机顶盒、车载电子、全球卫星定位导航系统、便携式多媒体数码产品、互联网家电产品等多个领域。Mstar已经和LG、三星、索尼、惠普、ACER、DELL、华为、富士康、康佳、海信、创维、长虹、TCL、夏华、海尔、同洲、BYD、好帮手等海内外众多企业结成长期合作伙伴。

218.78.220.241
5G技术

第五代移动通信系统(5th generation mobile networks),简称5G,是4G系统后的延伸。美国时间2018年6月13日,圣地牙哥3GPP会议订下第一个国际5G标准。由于物理波段的限制,5G 的网络也将会与其他通信技术并用,包含长距离的其他传统电信波段。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

OPPO机构

OPPO,成立于2004年,是一家全球性的智能终端和移动互联网公司,致力于为客户提供最先进和最精致的智能手机、高端影音设备和移动互联网产品与服务,业务覆盖中国、美国、欧洲、东南亚等市场。

www.oppo.cn
推荐文章
暂无评论
暂无评论~