根据摩尔精英CEO 张竞扬于2019.3.9 CASPA硅谷春季论坛演讲整理
摘要:半导体行业对AIoT一直抱有很高的期望,希望这些新应用能带来一个像PC电脑或者智能手机那样,海量的、统一的芯片市场。然而今天的现实是,大部分AIoT应用需求是碎片化、小批量的,为其投入一颗SoC的经济回报,甚至很难收回其NRE成本。我们应该坐等奇迹发生吗?还是需要转换思路,寻找消除这种不匹配的解决之道?在本文中,我们将探索Chiplet和Tier-1 IC品牌商带来的新可能,并探讨这将如何改变IC行业的业态,催生新的商业模式。
AIoT 是人工智能和物联网的融合
图片来源:Samsung
AIoT可以看成是物联网的下一个阶段——从简单的物物相连,到AI加持的智能设备万物互联。人工智能和物联网的融合是大势所趋,因为它们刚好互补,AI(无论Cloud还是Edge侧)需要物联网收集的数据来训练算法,物联网也需要AI算法建立的模型来作出决策。
近几年,各种智能硬件层出不穷,我自己就是一名发烧友,Google Glass, HTC Vive, HoloLens, MagicLeap等各种AR/VR, 无人机,智能电视,智能门锁,智能灯,扫地机器人等等,市面上能买到的智能硬件,大部分我都会买来试一试。那么,这些智能设备的用户体验到底如何呢?
尽管DIY的智能家居系统对我这个科工男来说还不错,朝我理想中的未来生活方式又迈了一步,但这个系统只对我特别友好,对于父母一代人来说,似乎就不那么智能也不那么方便了,Wi-Fi信号问题,电源中断,操作系统更新,电池耗尽......一个微小的干扰可能会破坏整个系统。当系统出现问题或者需要改变设置的时候,家里人觉得找我,比鼓捣设备或者App要来得方便,于是我就变成了一个人肉中央遥控器:-)
今天的IoT还远远谈不上成熟,对于大部分用户来讲还是太复杂,如果终端设备还需要人工干预,连接,登录,配置,那还真的是不够智能,也很难大规模地商业化落地。正因如此才有人说,目前所有的芯片都应该被重做一遍以支持AI功能。
今天的人工智能真的智能吗?
我们可以随机做个测试,拿出你的智能手机,对语音助理说:推荐餐厅,不要中餐,看看反馈的效果令你满意吗?即使是这样简单的一个对话场景,今天的语音助理也搞不定,未来两年内,我们很有可能仍将面临如此尴尬的情况。
为什么人类已经能够可以设计出像IBM Watson,Google AlphaGo这样强大的AI,却无法实现一个简单的聊天机器人呢?在去年的Google I/O开发者大会上,新一代谷歌助手采用Google Duplex技术已经可以像人类一样打电话,令人惊叹;但为啥一到手机上就货不对板了呢?
今天人工智能的硬件性能、成本和功耗,离日常使用还存在很大差距。AlphaGo的硬件成本和功耗都非常昂贵,在它和围棋世界冠军、职业九段棋手李世石的著名对决中,花费了约2万美元的电费。回到语音助理订餐的问题上,你愿意为餐馆推荐支付多少钱?
生物大脑vs超级计算机芯片
《深度学习》这本书的作者谢诺夫斯基,上世纪80年代就在研究神经网络计算, 1989年,谢诺夫斯基到麻省理工学院计算机实验室访问。气氛不算融洽,那里的人都质疑他的方法。午餐之前,谢诺夫斯基有五分钟的时间,给所有人介绍一下他讲座的主题。谢诺夫斯基临场发挥,以食物上的一只苍蝇为题,说了几句话。谢诺夫斯基说,你看这只苍蝇的大脑只有10万个神经元,能耗那么低,但是它能看、能飞、能寻找食物,还能繁殖。MIT有台价值一亿美元的超级计算机,消耗极大的能量,有庞大的体积,可是它的功能为什么还不如一只苍蝇?
在场的教授都未能回答好这个问题,倒是一个研究生给出了正确答案。他说这是因为生物的大脑是高度专业化的,进化使得它只具备这些特定的功能,而我们的计算机都是通用的,你可以对它进行各种编程,它理论上可以干任何事情,问题的症结也正在于此,因为专业化和通用化的结构不同,1百万神经元的昆虫专用大脑可以超过80亿个晶体管的通用芯片。
AIoT实现大规模商业化的前提,就是芯片要以相当低的成本和功耗,实现足够强大的性能,摩尔定律过去50年的发展,CPU的性能有了超过40万倍的提升,让AI实现有曙光,又远不能满足AI落地的性能、成本、功耗需求。
用专用ASIC(Domain Specific, Dedicated ASIC)来榨出极致性能
我们知道,在性能-灵活度的折中上,像CPU这样的通用处理器享有最大的可编程性和灵活度,但同等功能性能下,功耗最大; ASIC(Application Specific Integrated Circuit 专用集成电路)等于将使用场景固化,灵活度最小,但效率更优。
今天的大多数芯片,即使是许多所谓的ASIC,本质上仍然是多用途的。我们常常直接使用商业化IP和晶圆代工厂的标准单元库,尝试在一款芯片中尽可能多地组合功能,通过一次流片覆盖更多市场,快速上市。但所有这些捷径,都以降低芯片性能为代价。
如果我们把ASIC设计推向单一化的极致(Domain Specific, Dedicated ASIC),结果令人震惊。以加密货币挖矿计算为例,Benchmark的结果显示,同样成本下的专用ASIC效率,可以达到CPU的数十万倍。这些设计者们采用全定制基本单元库,手工来优化布局布线,挑战晶圆代工厂DRC的极限,用设计SRAM基本单元的方式设计芯片,任何能够优化的地方,他们都会大胆一试。有人说这是一种设计方法的倒退,浪费了大量的时间去做无意义的工作,但是矿机ASIC确实取得了惊人的性能。
过去大量的应用都可以用通用计算来解决,但是在AIoT的未来,硬件性能没有冗余,并且长期存在瓶颈,加密货币的案例给了我们一些启示,我们将一定需要ASIC,来释放出极致的性能。
每个物联网细分市场都用得起ASIC吗?
虽然明确ASIC在性能方面的优越性,但半导体行业从来都要算一笔经济账,碎片化的物联网市场,能够负担得起ASIC的投入吗?
过去,设计一款28纳米芯片的研发成本约为5000万美元,7纳米的研发成本上涨到3亿美元,而预测3纳米的芯片研发成本将达到难以置信的15亿美元之多。已经很少有芯片设计公司,能够承受得起这么昂贵的前期投入了。先进工艺制程的芯片研发成本不断攀升,大公司要看到10亿美金,100亿以上销售预期的市场才会进入,AIoT的早期无法一夜之间提供这样的市场机会。
另一方面,尽管AIoT市场总量巨大,但每个细分市场都过于分散,单品的需求量不大,为其投入一颗ASIC的经济回报,甚至很难收回其NRE成本。“物联网”这个词非常具有误导性,它将成千上万的碎片组合成一个单词,一个集合的概念。总量看起来是个巨大金矿,实际上是个高度碎片化而且贫瘠的领域。但是如果没有ASIC来提高性能和用户体验,这一个个细分市场又很难成长到上亿量级的出货。
专业化、多品类、小批量的芯片,要求上市时间更短,性能更高,还需要成本更低,多、快、好、省,简直就是Mission Impossible,我们如何才能完成这一不可能的任务?
摩尔定律暗藏伏线 - 异构集成Heterogeneous Integration
当1965年,戈登摩尔发表他那篇充满传奇色彩的论文 - Cramming More Components onto Integrated Circuits,他不仅提出了后来被称为“摩尔定律”而为人们所熟知的经典预言;同时,他也给我们留下了一条线索,如何用较小的组件,快速经济地构建一个大型的系统,那就是Heterogeneous Integration(异构异质集成)。
戈登 摩尔在论文中写道:It may prove to be more economical to build large systems out of smaller functions, which are separately packaged and interconnected.
对于极度追求性能却又碎片化的AIoT市场而言,异构集成可能是一条很好的出路。
Chiplet:类似乐高积木的“裸片IP”复用
最近,Chiplet这个概念热了起来。简单来说,Chiplet技术就是像搭乐高积木一样,把一些预先生产好的实现特定功能的芯片裸片(die),通过先进的封装技术(比如3D, 2.5D)集成在一起形成一个系统芯片。而这些预生产裸片就是Chiplet。从这个意义上来说,Chiplet是一种新的“裸片IP”复用。
像乐高积木一样,把不同模块组合在一起的想法,已经被半导体行业讨论了近十年,但真正进行商业化探索,还是在近几年,晶体管的尺寸越来越接近技术极限,按照摩尔定律进一步缩减晶体管特征尺寸的难度越来越大之后。
Marvell的创始人Sehat 博士,在ISSCC 2015上提出了Mochi(模块化芯片)架构的概念。2017年,DARPA推出了CHIPS计划,专注于开发可根据需要组合的芯片,即将一系列模块化芯片或Chiplets,通过die-to-die的互连方案封装集成。理论上,Chiplet是一种开发周期短且成本较低的方法,可以将各种类型的第三方芯片(如I / O,内存和处理器核)组合在一起。
SoC,Chiplet和PCB的比较
对SoC,Chiplet和PCB进行设计成本、时间、风险和性能、功耗、产品尺寸等多维度的比较,可以看到Chiplet是SoC和大多数分立器件PCB之间的折衷方案,相比SoC,只牺牲了少量性能,但研发投入和研发周期已经大大降低。
特别的,针对AIoT市场,Chiplets模式提供了制造工艺选择的灵活性。我们可以经济高效地将先进工艺制造的高性能计算单元,和主流成熟工艺制造的模拟/射频模块,集成在一个封装中。
Marvell Intel AMD zGlue 的Chiplet探索
Marvell自4年前推出MoChi架构以来,推出了一系列Virtual SoC产品(从产品Datasheet里可以看到),Mochi可以是许多应用的基准架构,包括物联网,智能电视,智能手机,服务器,笔记本电脑,存储设备等。但遗憾的是,随着创始人Sehat卸任CEO,近一两年没有听到太多Mochi相关的新消息。
Intel在高级封装领域一直处于领先地位,之前的EMIB技术就有其独到的优势,而2018年12月Intel发布的Foveros技术则是3DIC方面一个长足的进步。Foveros架构中,芯片3D堆叠在有源硅载片上,并通过硅载片做互联。相比2.5D封装,使用Foveros的3D封装大大提升了集成密度,同时芯片与有源硅载片之间的IO带宽也有潜力能做更大,从而获得更大的性能提升。
Intel的Foveros多少也是对AMD于前一个月发布的Rome架构处理器的回应。2018年11月,AMD发布的Rome架构处理器也是基于高级封装,由多块7nm Zen2处理器芯片粒和一块14nm 互联和IO芯片使用2.5D技术封装而成,其中每块7nm Zen2芯片粒都含有8个核,而多块芯片粒经过组合最多可以实现64核,芯片粒之间则通过14nm互联芯片进行芯片间通信。
初创公司zGlue也宣布了针对物联网的商业产品,帮助客户加速产品开发和将差异化产品推向市场。他们提出了一个称为ZiP的集成平台,利用Chiplet,Smart Fabric™可编程interposer,和基于云的设计软件,实现芯片的低成本快速开发。
Chiplet普及化有机会催生新的商业模式
在今天的半导体产业价值链中,IC设计公司起着至关重要的主导作用,他们从供应商处购买IP(Intellectual Property),采购EDA(Electronic Design Automation)工具进行设计,再向晶圆厂下单进行芯片制造,再封测,最终直接或者通过分销商,销售芯片给系统公司客户。但如果某天,Chiplet成为主流的选择,当小芯片的标准建立起来时,有数十万个商业化的Chiplet可供选择,接下来会发生什么?
半导体产业的新结构 - Tier-1 IC品牌商
生产力的进步,必然带来生产关系的变化。
如果我们看看汽车工业会发现,经过一个多世纪的发展,现在这个成熟行业的分工,包括汽车整车厂OEM,Tier-1,Tier-2,Tier-3供应商。一级和二级供应商的合作关系很有趣,一级供应商高度依赖二级供应商的专业技术技能,从Tier-2购买组件并将其打包成汽车级系统卖给整车厂,二级供应商制造零件并乐于将其销售给Tier-1。整车OEM客户更加信任一级供应商,基本上都是从Tier-1供应商处进行采购。
今天,半导体产业链中还没有Tier-1、Tier-2的结构,传统的IC设计公司同时兼任了两者,他们设计整个芯片,最后销售芯片产品。Chiplet,可能推动整个半导体行业的演化,Tier-1芯片供应商这一新物种将会出现。就像汽车行业一样,一级芯片供应商(我们也可以称之为品牌商)可以从二级Chiplet供应商处购买小芯片,并将其整合成SIP。Tier 2制造小芯片并且很乐意将它们出售给Tier-1,系统公司将主要信任和采购来自Tier-1 IC供应商的器件。
哪些玩家有机会成为Chiplet和Tier-1 IC供应商?
新结构,新牌桌。谁将最有可能赢得这场新游戏呢?
小型的芯片设计公司,IP供应商,甚至晶圆制造和封装测试供应商,都有机会成为Chiplet供应商。最终,IC设计公司和IP供应商之间的界限将会模糊,它们将全部转变为小芯片或者说硬IP供应商,并将Chiplets推向市场。
如果一家芯片设计公司可以通过Chiplets轻松获利,而不必担心供应链,销售和市场营销,那么这将像独立工作室一样敏捷、灵活、高效;如果工程师可以作为独立设计工作室赚大钱,那么对于大型设计公司而言,按照原先的利益分配机制,想要留住这些天才,将会更加困难。
另一方面,谁将有机会成为一级IC供应商?
大型IC设计公司,分销商,模块制造商都可能有发言权。事实上,他们会争先恐后地竞相成为一级IC供应商,以获得更多利润。以经销商为例,在传统的半导体行业成本结构中,他们通常只能赚到芯片销售额3-5%的毛利(如果不是缺货炒货的话); 但一旦成为一级供应商,购买Chiplet并集成到SIP中,将有机会将毛利率提升至50%!(按IC设计公司毛利率的中值估算)经销商对市场趋势和要求非常敏锐,一旦他们获得像Chiplet这样的强大武器,补齐技术短板,他们也可以像芯片设计公司一样逐鹿中原。
Tier-1 IC品牌商诞生后的全新生态系统
凯文凯利说,所有企业都难逃一死,所有城市却几乎不朽,企业总想成为封闭的帝国,城市才是开放的生命体。
经过多年的商业实践,领先的芯片设计大公司已经开发出一套高效的内部协作机制,用集团层面的供应链运营能力,支持数百个研发部门,同时用统一的渠道和品牌来销售所有产品。每个研发部门都像特种部队,快速移动,共享资源,从整合的后台得到及时的支持,快速发展。
随着Tier-1 IC品牌商、Tier-2 芯片Chiplet供应商的出现,可能会出现一个更开放、更有活力的新生态系统。“但求所用,不求所有”,未来,不一定所有资源和技术能力都属于某家大公司,而更有可能是一个由许多Chiplet Studios(芯片设计工作室)有机组合的生态系统,依托生态系统所整合的强大制造和运营能力,聚焦核心研发,完成快速创新。
规模化的品牌商,Tier-1 IC供应商大公司,拥有成熟完善的供应链体系,甚至工厂,销售渠道,是芯片设计工作室的核心技术能力的放大器。这种一级芯片供应商+芯片设计工作室的开放生态系统,能够更好地服务碎片化的AIoT市场。
摩尔精英:半导体的阿里巴巴,让中国没有难做的芯片
为了共同创造这个开放的芯片生态系统,摩尔精英进行了一些探索。为了使芯片设计简单高效,我们正在构建未来的半导体基础设施,赋能芯片设计公司,提升行业效率,就像阿里巴巴在电商领域提供流量、物流、支付服务,赋能平台上的电商一样。
目前摩尔精英在全球拥有超过260名全职员工,包括芯片设计工程师、供应链运营专家、晶圆技术服务工程师、封装测试工程师等等。我们为全球超过1,500家无晶圆厂IC客户提供芯片设计服务,供应链运营,人力资源和企业服务,正在努力成为半导体行业的阿里巴巴,成为孕育Chiplet的土壤,帮助中小型芯片设计公司获得成功。
支持IC Design Studio的一站式平台
大多数芯片设计初创公司,特别是中国本土很多不超过50人的初创公司,从规模上来说,实际上都接近一个产品研发部门或设计工作室,他们最重要的核心能力是技术,对于这些CTO背景的企业家来说,学习一套完整的公司运营体系,销售运营供应链,消耗了本应投入核心产品定义和研发的,大量的时间和精力,同时,在芯片起量到一定规模之前,招聘一个十项全能的完整团队也是不经济的。
摩尔精英提供一站式半导体专业服务平台,将这些CTO技术大牛们从繁琐的公司销售、运营和供应链事务中解放出来。 我们希望帮助这些IC Design Studio专注于发展其核心技术长板,成为其细分市场的全球前三名。
总结
今天AIoT还不够智能,需要ASIC来提升其性能,改善用户体验。但AIoT终端应用碎片化,尽管市场总量巨大,其中每个细分市场却不大,传统的SoC方法成本太高,无法平衡性能和成本。
Chiplet技术及其商业化正在被各厂家积极探索,Chiplet,Tier 1 IC品牌商等商业模式创新可能会带来新的出路。摩尔精英正在努力构建一站式平台,以使中小型IC设计公司获得成功。
如果把芯片市场比喻成为一个金矿:
第一批来的淘金者遇到PC市场,捡到几块最明显的大金块——这一波浪潮,成就了英特尔;
第二批来的遇到手机市场,翻了翻捡了不少小金块——这一次,成就了高通、联发科、博通;
第三批来的遇到AIoT,再也没有露在外面的金块了,只能耐心建工厂,挖掘磨碎了整座金山,仔细筛洗金矿石,然而在淘金热的历史上正是这第三批人最后挖到最多金子。
今天半导体行业整体产值才占了全球GDP的不到0.6%,有大量细分领域的金矿石等待我们挖掘筛洗,虽然不像捡金块那么轻松,但只要用对的方法,我们有机会在AIoT时代淘到最多的金子,谢谢!
参考资料:
1.G. E. Moore, Cramming More Components onto Integrated Circuits
2.https://www.darpa.mil/program/common-heterogeneous-integration-and-ip-reuse-strategies
3.https://semiengineering.com/semiconductor-industry-getting-serious-about-chiplets/
4.唐杉,从AI Chip到AI Chiplet https://mp.weixin.qq.com/s/hMn0R0rHpUHEkfaQ6_BSaQ
5.王方林,像搭积木一样造芯片?
https://mp.weixin.qq.com/s/P7jwuAfOrR-vQB_qWNpG7w