Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AI芯片市场最强预判:华为苹果高通为何数亿美元豪赌7nm?

主流核心玩家比任何时候都渴望「爆款」的出现,以刺激阈值不断提升的消费者神经。从去年后半段开始风靡的「AI 手机」当之无愧成为「爆款」的热门关键词。人们期待 AI 拓宽手机终端的边界,一如当年智能机对功能机的颠覆。然而,如果 AI 手机的角逐只停留在参数对比和跑分排位,那么竞争远未触达本质。

一面是市场销量增长乏力,一面是巨头对手步步紧逼,手机业竞争的残酷指数再度升级。

金九银十,手机市场亦是如此。在不到半个月的时间里,华为 Mate20、苹果 iPhone X 二代两款全球最强旗舰机即将揭开最后面纱,安卓阵营里的其他玩家 OPPO、小米、联想也在积极准备亮出更强底牌。

手机战场正酣时,来自 IDC 的全球手机市场报告却释放出不容乐观的信号:智能手机行业增速在过去一年遭遇了史无前例的滑铁卢,并且主要来自于中国智能手机市场的乏力。

主流核心玩家比任何时候都渴望「爆款」的出现,以刺激阈值不断提升的消费者神经。而从去年后半段开始风靡的「AI 手机」当之无愧成为「爆款」的热门关键词。人们期待 AI 拓宽手机终端的边界,一如当年智能机对功能机的颠覆。

自一年前的麒麟 970 问世以来,「全球首款 AI 芯片」的标签无疑为国产芯打上了一针强心剂。自 2000 元不到的荣耀 10 到 5000 元以上的华为 P20 Pro,麒麟 970 几乎把华为的所有机型都加持了一个遍。紧随其后发布的是苹果内置有神经网络加速模块的 A11 Bionic 仿生处理器,Face ID、Animoji 等创新应用让 iPhone X 惊艳四座。

而今年初高通开放的人工智能引擎 AI Engine 则让骁龙 845 在异构基础上实现了 CPU、GPU、DSP 等众多硬件模块的协同处理,让安卓玩家在终端侧就能够实现算法优化和 AI 应用。

内置AI芯片开始成为打造一款AI手机的必要条件。

可以预见的是,在即将开打的2018新机换购大战中,围绕高通、苹果、华为三大芯片巨头展开,以及三星、谷歌、联发科等选手积极参与的“AI芯”战场必将升级为要塞之地,头号玩家非骁龙855、麒麟980和苹果A12处理器莫属。

继去年的10nm工普及艺之后,摩尔定律快速进入到7nm世代。三大巨头不惜巨资押注台积电最新7nm工艺,背后是对于芯片AI化计算趋势的笃定,同时也为三家公司率先拿下了新一轮“AI芯”战场的入场券。

但同一水平线的起跑赛道并不代表着技术实力的追平,高通、苹果、华为三家公司在手机芯片领域的能力排位仍需全面分析。

作为全球第一大移动芯片供应商,高通占据着四成以上的 SoC(系统芯片)市场份额,以远高于竞争对手的市场地位占据绝对优势。从过往的市场表现来看,安卓准旗舰芯片骁龙855在年底发布后将统治全球智能 SoC 榜单大半年。

而与高通主要供货于安卓玩家不同,苹果A系列与华为海思芯片主要用于自产自用,凭借两家公司全球 Top3 的手机出货量带动其芯片出货。

低调的苹果虽然很少拿自家的处理器性能作为卖点,但一如苹果产品本身,每次A系列处理器的实际表现都能轻松凌驾于整个安卓阵营,即将出货的A12也不会例外。

过去一年,华为海思用麒麟 970 优秀的参数跑分向市场证明,高通和苹果在手机处理器领域并非不可战胜,但在过于激进的降库存战略已经引发部分「花粉」(华为用户)不满。这样的背景下,麒麟 980 承担着背水一战的民族使命,在产品周期已经领先的基础上,以求追平甚至超越同期对手芯片,摘下名副其实的安卓旗舰桂冠。

然而,如果AI手机的角逐只停留在参数对比和跑分排位,那么竞争远未触达本质。

从智能手机到人工智能手机的更新换代,市场的最大诉求点和期待究竟是什么? NPU 的打磨只为现有文字处理、语义理解、图片识别等功能的加速?特别开辟的神经网络加速器仅为 Face ID 等原生应用而建?

直面争议与质疑,别让AI手机仅止步于概念。

3亿美元入场券

手机处理器形态千万,却也逃不开IP垄断户ARM的影响。一款处理器的CPU性能强弱,除了和自主研发的架构相关,最重要的影响因素就来自于ARM的CPU核心。

实际上,ARM正是新一代7nm工艺背后最为有力的推动者。

今年6月,ARM发布了新一代移动处理器Cortex A76架构,使用7nm工艺制造,频率可达3GHz。和前代的A75相比,Cortex A76性能提升了35%,功效提高了40%。更为重要的是,Cortex A7能够提供高于现有机器学习的4倍性能,这恰恰也是苹果、华为、高通、联发科等一众手机芯片厂商翘首以盼的增长点。

据市场预测,目前开发10nm芯片的成本超过1.7亿美元,而7nm则达到了3亿美元,5nm更是高达5亿美元,3nm直接将超过15亿美元。随着工艺成本的大幅提升,仅高昂的入场券门票就足以甩开中低段位选手,在手机IC领域如今也只有华为、高通、苹果等敢于投入跟进这场豪赌。

相比三星的激进策略,稳扎稳打的台积电似乎更受手机厂商青睐,今年来自苹果、华为、高通的7nm订单全都押注在了台积电产线上,今年初正式投产预计明年将引入EUV光刻工艺。

按照台积电CEO魏哲家的说法,到2018年底将有超过50个产品完成7nm设计定案(Tape out)。其中,AI芯片、GPU和矿机芯片占了大部分的产能,其次是5G和应用处理器(AP)。与10nm工艺相比,台积电的7nm工艺密度提升为1.6倍。台积电声称其7nm工艺将性能提高20%,功耗降低40%。

电子创新网创始人张国斌评价道,不同于10nm仅用于移动处理器,7nm工艺将适用于各类处理器,所以7nm将是半导体工艺上的一个极其重要的工艺节点。可以预见的是,围绕这个节点EDA公司和IP将开发大量产品,7nm工艺将或类似于28nm工艺节点,将维持一段较长的生命周期。

此外,随着集成电路工艺要求的提升,针对芯片接点引脚和电路板连接的封装工艺也更为先进。

根据台积电公布的7nm工艺资料来看,台积电为7nm工艺开发了系统级封装技术SiP,它被认为是5G高速连接时代的重要封装技术,或将为后续的7nm手机引入5G功能提供预留便利。

芯片战略需要长期投入,在流片之前,长期的设计投入与验证布局更能体现手机和IC 厂商的前瞻性。

华为子公司海思半导体进军手机处理器至今已经5年有余,从最开始泥沙俱下的K3V2到去年广受好评的麒麟960,在风风雨雨中已经迭代了6代产品。有报道指出,在总共1万人的海思团队中,有3000人在做手机芯片。

自推出手机处理器以来,华为一直坚持在自家高端产品使用自家海思的处理器,虽然前期饱受非议,但在几乎所有的国产手机厂商都受制于高通或联发科的当下,尤其在「中兴事件」之后,华为在芯片自研技术道路的坚持获得了更多人支持。

与华为一样,芯片是苹果最重要,也是最为神秘的部门。

从2010年发布iPhone 4开始,苹果就采用了自主设计的A4处理器。苹果的芯片研发历程最早可以追溯到2007年。据首席财务官卢卡·马斯特里称,苹果每年数以十亿美元计的资金投入中,大部分都花在研发各种诸如芯片、传感器的基础技术上。

巨头很早就意识到,自研芯片能够让其将尽可能多的技术和生产流程掌握在自己的手里,从而实现对供应链的完全控制,让更多的创新技术变得难以复制。

在解决了设计研发、量产工艺等难题之后,芯片厂商摩拳擦掌为上市准备。然而,产线供货能力吃紧却成为三大巨头需要共同面对的当务之急。

就在上个月,台积电工厂遭到病毒攻击,并导致数条生产线被迫中断,而其中7nm制程的生产基地就被列入受影响的范围之中。对于即将开售的iPhone X二代及其A12 芯片,以及搭载麒麟980的华为Mate 20是否会受到产线停摆的影响仍是个未知数。

最强赛场

ARM和台积电为三大芯片巨头建立了牢固的先发优势,但核心的芯片架构设计才是各家形成差异化竞争格局的核心。

麒麟980将继续采用主芯片+NPU专用模块的设计。核心架构层面, CPU为ARM最新的四大核A76和四小核 A55,最高主频 2.8GHz,基带由Cat.18升级到 Cat.19。

专用AI 硬件处理单元层面,华为将继续沿用寒武纪IP核,预计将会是今年5月推出的第三代终端IP产品Cambricon 1M。

该NPU同样采用台积电7nm工艺生产,提供2Tops、4Tops、8Tops三种规模的处理器核,并支持多核互联,其8位运算效能比达5 Tops/W(每瓦5万亿次运算),性能比前任麒麟970采用的寒武纪1A高10倍。

值得注意的是,此前多份报告称华为麒麟980将采用ARM Cortex A77 CPU多核心,但随后遭到ARM官方的否认,麒麟980配备的是Cortex A76,虽然A 77性能更高但尚未公布。

而关于麒麟980将搭载华为新一代的自研GPU的传言也不攻自破。根据最近外媒关于麒麟980的参数信息,麒麟980将继续采用ARM提供的GPU Mail系列Mail-G72 MP24。相比麒麟970采用的Mail-G72 MP12系列,麒麟980的GPU核数提升到24核心,增加一倍。

今年苹果的A12芯片暂未被曝出大的升级处理。

此前曾多次准确爆料的移动处理器博主i冰宇宙表示,苹果A12可能沿用A11架构,处理器跑GeekBench 4单核成绩是5200分,而多核性能是13000分上下,相较于A 11跑分成绩,性能提升约25%,足以秒杀同期芯片。

目前,苹果正在解决功耗问题,7nm情况下平均功耗依然比预期高出23%。外媒评论称,苹果将重新设计功能的iOS12,此举有望降低对A12处理器的杀伤力。

值得注意的是,去年苹果发布的A11处理器只能称为仿生芯片,今年A12处理器定然将会在AI功能上大有改进,以达到真正的AI芯片级别。

对于高通而言,相比去年仅有SDK实现异构计算性能的提升,今年最大的惊喜将是引入NPU内核。这与去年麒麟970搭载的NPU类似将用于提升AI性能。

作为单纯的上游芯片供应商,高通在高性能之外,还需要考虑应用场景和工艺成本等要素,在AI芯片方案上相对华为和苹果更为保守也情有可原。

今年高通引入NPU之后,也预示着在人工智能大潮下,AI芯片的设计方向最终归一于独立AI模块的设计思路,多硬件单元组合式的异构计算单从SDK层面优化难免力不从心。

而在主流AI芯片玩家之外,三星、联发科,以及谷歌等选手也在积极试探市场。

今年3月,联发科的首款AI芯片Helio P60在国内亮相,与高通骁龙845一样没有独立AI处理单元,其设计初衷是通过多颗DSP的能力来提升图像后处理的运行效率,顺便可以做些AI相关的图像处理算法。

该芯片能够称得上现在市面上能够买到的最为实惠的一款AI芯片,出货量表现不错,同时为联发科第二季度财报赢来了超预期表现。

同样在3月,三星发布了型号为Exynos 9610 的新一代处理器,采用专用AI 硬件单元,三星称之为Vision Image Processing Unit(可翻译为视觉图像处理单元),可以算作是三星真正意义上的一款智能手机AI 芯片。

而早在去年10月,谷歌在Pixel 2系列智能手机就隐藏了一个秘密武器,即谷歌自己研发的第一款移动芯片,它被称为Pixel Visual Core,它是谷歌针对消费类产品的首款定制片上系统(SOC),目前专门用于加速相机的HDR+计算,使图像处理更加流畅和快速。

但目前该芯片还处于「休眠状态」。谷歌方面表示,在更新 Android Camera API 之后,以允许第三方摄像头开发人员使用 HDR +和 Pixel Visual Core,它们将成为 Android Oreo 8.1 预览中的开发人员选项。

内行看门道

实际性能并不等于峰值参数,还需要取决于软硬件协同优化效果。这一道理在华为麒麟与苹果A系列的对比中尤为明显。

去年,华为曾用植入了寒武纪A1的NPU在性能参数上碾压A11。比如,A11 Bionic内置的神经网络引擎浮点性能仅为0.6T(即能以每秒最高6000亿次速度处理机器学习任务),而麒麟970NPU的浮点性能达到1.9T,是A 11的三倍还多。

但是别忘了,苹果是最懂得软硬件结合的手机厂商,在浮点性能不及对手的劣势下却将能够最大化利用。早在iPhone X发布之前,苹果在去年年中的WWDC开发者大会上就已经推出Metal和Core ML两个不同层面的接口供开发者调用,以加速iOS平台上的人工智能应用。

苹果曾提到A11专门为Metal 2 和Core ML设计。有半导体业内人士猜测,A11可能对DSP进行调整,在软件层面针对CPU和GPU加速的硬软件结合实现的“神经网络引擎”。

参考海外知名处理器性能跑分工具,同时也是公信力最高的GeekBench 4实测结果。麒麟970(BLA-L29的Mate 10 Pro)的GeekBench 4跑分单核是2000分左右,多核6200分左右,而骁龙845的GeekBench 4单核在2500左右、多核在8500分左右。作为对比,A11单核和多核分別在4245和10100左右。

在主核CPU之外,影响终端性能表现,尤其是图像、影像等数据处理效率的核心还是GPU性能。相比高通,华为和苹果的AI芯片此前的短板之一都体现在GPU层面。

高通的 Adreno GPU 一直都是业界标杆,据说「虐杀」一众竞争对手的 Adreno 630(骁龙 845)还只是高通 Adreno 家族的中端低功耗产品,真正杀手级别的 GPU 是强化版的 Adreno 640 和堪比 PC 显卡的 Adreno 680。

不过按照高通一贯的新品节奏,骁龙 855 究竟采用哪款 GPU 可能到今年底才会正式揭晓。

曾有早期评论提到,麒麟970的能耗比是完全被骁龙835吊打的,甚至还不如骁龙820/821,三星Exynos 8890/8895,实际使用远远无法达到国内跑分测试数据。

麒麟970的Mali-G72 MP12在跑分上确实超越了Adreno 540,但是也仅限于跑分了,麒麟970的GPU跑分完全是不计功耗的跑分强行超越了骁龙835。按照这个趋势下去,如果麒麟980继续采用Mali系列的GPU,仍然远不如骁龙845,更不用提追平下一代架构提升的骁龙855了。

此前,一加刘作虎曾谈到“麒麟处理器要想超过骁龙处理器,十年之后再说。”而华为余承东最近给麒麟980贴上的预热口号则是“麒麟980遥遥领先骁龙845和苹果处理器”。

华为的底气何在?

本月初,华为针对GPU性能提速的杀手锏得以问世。这是来自华为2012实验室的两项新技术:THE NINE液冷散热技术和和双Turbo技术(CPU Turbo+GPU Turbo)。

先于今年6月问世的GPU Turbo已经打通华为EMUI操作系统和GPU、CPU之间的处理瓶颈,官方数据显示,使得图像处理提升60%,能耗降低30%。

而CPU Turbo基于THE NINE液冷散热技术,将芯片产生的热量快速均匀分布到机身其他部位并迅速散发出去。据介绍,整体散热性能提升41%,在激发CPU的极限性能的同时使CPU最高可降低10℃。

而苹果方面同样没有让人失望。从GeekBench 4的GPU测试分数来看,A12分数是21691,而A11的表现只有16091,提升至少在30%以上。作为即将承担大量AR应用的苹果在A12而言,GPU的优化将是工作重点。

就现阶段的几款AI芯片整体表现来看,作为辅助工具的AI专用芯片模块仍然只能扮演锦上添花的作用,重头戏仍然由GPU性能决定。

不敢掉队

那为什么还要使用专用硬件解决方案呢?

国际知名媒体Android Authority曾提到这样一个观点:在桌面级芯片领域,独立的FPU(浮点运算单元)芯片的出之后,极大的提高了桌面处理器的浮点运算能力,打开了处理器新世界大门。对于现如今移动芯片领域而言,亦是如此。

今年5月,中国电信发布的《AI终端白皮书》支持了这一看法。白皮书将AI手机定义为基于专用AI 单元或通用硬件单元(CPU、GPU、DSP)综合调度提供AI算力,并加载深度学习AI应用的全网通手机。

趋势之下,玩家不敢轻易掉队。然而在过去一年的试水期里,市场似乎并不乐意买单。

追踪旭日大数据公布的2018年三、四月份的全球手机芯片出货量数据,排名前五的仍是针对中低端市场的芯片,其中联发科的“首款AI芯片”P60以703万片冲进四月榜单中的第二名。

而华为的麒麟970最好成绩来自于四月榜单中的第8位,出货量达到410万。与此同时,高通的高端处理器高通骁龙845芯片排名第16位,出货量168万片。但结合华为自身强推麒麟970的去库存战略和高通地位而言,数据表现并不能算得上理想。

一般来说,一款处理器有其自身中高低端的定位;如果口碑极佳,那可能被很多厂商反复使用,例如骁龙625、骁龙660,并不常见。比如,高通骁龙845是目前高端手机的御用芯片,搭载这款芯片比较火的手机有小米mix 2S、一加6、坚果R1等手机。

但是华为和荣耀就比较尴尬了,从1999元到9999元的手机都用麒麟970。这通常是库存处理器过多无法及时消化的表现,在某种程度上也引发了消费者们的吐槽。

对于高通845出货量较低,业界普遍观点则认为,一是搭载这款芯片的手机价钱都比较高,性价比较低,二是高通马上要推出新款855处理器,而845处理器无论是价钱还是实用性都处于一个比较尴尬的位置,所以导致这款芯片的出货量远远低于高通4系列和6系列的处理器。

实际上,手机处理器在一款手机的BOM清单中一直占有不小的比例。

今年三月,小米创始人雷军就在个人微博称:「骁龙 845,最新旗舰,非常出色,只有一个缺点:太贵了!!!骁龙 845,再加上 17% 的进口增值税,500 多元!是骁龙 660 的三倍多!」

不得不承认,集成NPU短期内将会大幅增加处理器的成本,而能够支付起该成本的只能是通过应用生态带来的市场需求。

从参数上看,麒麟 970 性能着实强悍,然而在华为手机上并未完全释放其卓越的性能,就其当下应用来看似乎有些「浪费」,

华为为 NPU 挖掘的功能包括「AI 慧眼识物」、「AI 精准虚化」、「随行翻译」等。华为选择与微软翻译、百度等合作,通过 AI 芯片,加速文本、语音、照片的翻译速度,提升用户体验。

然而,到目前为止,华为对于麒麟970 NPU的打磨也仍然停留在文字、语音、图片识别阶段,仅仅把这颗AI芯片作为辅助性工具,尚未有深层次的开发应用。

与麒麟970类似,iPhone X搭载的A11目前可见的作用可以在拍照、AR、Face ID方面体现。不过,苹果的神经网络加速模块也只对原生应用进行支持。

早在WWDC 2017开发者大会上,苹果先于iPhone X就宣布了一系列新的面向开发者的机器学习API,包括面部识别的视觉API、自然语言处理API,这些API 集成了苹果所谓的Core ML 框架。

从上图可以看到,Core ML的底层是两个神经网络子程序框架:Accelerate and BNNS和Metal Performance Shaders。Accelerate是在CPU上进行快速计算的框架,而Metal负责深度挖掘GPU性能。 

据不便透露公司名称的巨头IC半导体资深工程师向机器之心表示,苹果实际上主要将数据处理加速工作集中在GPU层面。

著名投资人 Benedict Evans 曾提到,「往深了看,很多机器学习技术正在被商业化,它们的 API 快速地进入到移动设备上……不可能只有一个 Google 或一个 Facebook 的云包揽所有的机器学习——这项技术应该是一切的基础。」

从英伟达在人工智能浪潮中得以快速崛起的案例中不难发现,生态积累是比技术更持久的“护城河”,而开放易用的CUDA接口则是建立开发者生态的前提。为了迅速做大开发者规模,手机巨头平台开始在初期释放超高分成与合作资源。

2018年初,华为发布了AI开发平台HiKey 970,推动AI应用生态搭建,并将投入10亿元用于鼓励开发者创新。6月,余承东在华为终端首届开发者大会上就宣布,将投入10亿元补贴主力开发者的创新智慧服务。苹果则在不遗余力地扩建Core ML 中的API。

市场还在嗷嗷待哺地等待着一个 AI「爆款」。

产业AI芯片华为苹果高通
1
暂无评论
暂无评论~