Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

机器之心编辑部报道

全球首款5nm服务器芯片,阿里平头哥「倚天」问世:基于Arm架构,业界最强

目前业界性能最强的 ARM 服务器芯片,性能超过业界标杆 20%,能效比提升 50% 以上。

10 月 18 日是 2021 云栖大会的开放日,在 40000 平米的展区中,有一个展位格外引人注目。

这里展示着阿里的「芯片家族」:从平头哥首颗芯片玄铁 910 到首颗自研高性能 AI 芯片含光 800,再到其他专用芯片,阿里这两年的造芯之路「几乎」一览无余,只有红布之下是个例外。

「红布之下是什么呢?」「到明天云栖大会开幕就知道了。」现场工作人员卖起了关子。

十几个小时后,阿里云智能总裁、达摩院院长张建锋为我们揭开了谜底:原来这是阿里平头哥芯片家族的新成员——倚天 710。它采用了业界最先进的 5nm 工艺,单芯片可容纳高达 600 亿颗晶体管。

和专注于 AI 推理的含光 800 不同,倚天 710 是一颗通用服务器芯片(CPU),也是 第一颗采用 5nm 工艺的服务器芯片。它基于最新的 Armv9 架构,内含 128 核 CPU,主频最高达到 3.2GHz,能同时兼顾性能和功耗。

在内存和接口方面,它集成了业界领先的 DDR5、PCIE5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。

在 SPECInt2017 基础测试平台上,倚天 710 的跑分达到 440 分,是当前性能最强的服务器芯片,超出业界标杆 20%,能效比优于业界标杆 50%,能有效帮助数据中心节能减排。

阿里表示,倚天 710 是阿里云推进「一云多芯」策略的重要一步,也是阿里第一颗为云而生的 CPU 芯片,即将在阿里云数据中心部署。

「基于阿里云『一云多芯』和『做深基础』的商业策略,我们发布倚天 710,希望满足客户多样性的计算需求,这款芯片不出售,主要是阿里云自用。我们将继续与英特尔、英伟达、AMD、ARM 等合作伙伴保持密切合作,为客户提供更多选择。」张建锋介绍说。

作为一家电商、物流、云计算、大数据、全球化等场景的公司,阿里拥有世界上最挑战、最丰富的计算场景、网络场景、机器学习场景,需要使用大量芯片,自研芯片能够降低阿里巴巴集团内部整体计算的成本。随着倚天 710 的发布,平头哥已拥有处理器 IP、AI 芯片及通用芯片等产品家族。其中,玄铁系列为 AIoT 终端芯片提供 IP,出货量已达 25 亿颗;含光 800 为人工智能场景提供 AI 算力,服务于搜索推荐、视频直播等行业;倚天 710 则通过阿里云为云上用户提供算力。

从玄铁到含光再到倚天,平头哥三年完成「三级跳」

造芯难,一直是这两三年的热门话题,国内企业也在快马加鞭补齐芯片设计的短板。但在高性能 CPU 市场上,国内还没有太多成功的经验。正如中国科学院微电子研究所所长叶甜春所说,集成电路就是一座喜马拉雅山,而核心芯片就是珠穆朗玛峰,「需要全世界最高端的技术。」

为了攀登这座高峰,阿里早在几年前就开始了布局。

2016 年,阿里投资软件定义网络(SDN)芯片公司 Barefoot 以及翱捷科技、寒武纪、深鉴、耐能、中天微、恒玄科技等多家芯片公司;2017 年又成立了达摩院并组建了一支由半导体行业顶级专家组成的技术团队。

2018 年,阿里全资收购大陆唯一拥有自主嵌入式 CPU IP core 的中天微。在那年的云栖大会上,达摩院芯片研发团队与中天微团队合并,平头哥半导体公司就此成立。
 
在之后的三年里,平头哥完成了「三级跳」:先是发布了当时业界性能最强的 RISC-V 处理器玄铁 710,让基于 RISC-V 架构的高性能芯片成为可能,也让芯片设计的门槛进一步降低;紧接着,在 2019 年的云栖大会上,平头哥又发布了阿里第一颗芯片含光 800,这是一颗针对场景深度定制的芯片,创造了性能和能效比的两项第一;再接着就是今年云栖大会倚天 710 CPU 的问世

CPU 是半导体行业设计门槛最高的芯片之一。为了达到通用服务器 CPU 的性能、功耗要求,倚天 710 采用了很多领先的技术,包括 Armv9、DDR5、PCIE5.0 等,并对它们做了深度定制。

Armv9 是 ARM 公司在今年 3 月份正式推出的新架构。它的前辈——ARM 在 2011 年推出的第一款 64 位架构 Armv8——之前已经在服务器领域取得了一些成功,不少企业基于此架构开发了可用于服务器和超算领域的产品,个别产品也获得了不错的效果,让 Arm 芯片从小型或移动设备,进入了新的领域。Armv9 在此基础上进一步创新。根据 ARM 官方的介绍,新的 Armv9 架构将会至少使用 10 年,未来两代基于 Armv9 架构的处理器在性能上有望提升 30%。而且与 Armv8 架构不同的是,Armv9 架构的适用范围更广阔,其一系列改进不少都是为了 Arm 架构芯片可以实现高性能计算做铺垫。

长期以来,X86 服务器一直占据市场主导地位,而且构建起了成熟的商业生态并占据专利和标准制定等战略高地。相比之下,ARM 芯片在服务器领域存在性能劣势以及生态环境的阻力。Armv9 的一系列改进为芯片企业进一步探索基于 Arm 的服务器芯片设计提供了信心。

除了这些国际领先技术,倚天 710 还引入了许多自研技术,从前端架构设计到后端物理实现都是自研

在前端设计方面,为解决核数众多条件下的带宽瓶颈,平头哥对于片上互联作出特殊优化,采用新的流控算法,降低系统反压,有效提升了系统效率和扩展性,使单核高性能有效地转化为整个系统的高性能。此外,通过新的系统地址到 DRAM 地址的转换机制,倚天 710 支持安全、非安全隔离、多 NUMA、异常通道隔离多种特性,同时 DRAM 读写效率大幅度提升。

在后端物理实现方面,5nm 工艺对能量密度、芯片内部结构的布局提出了极高的要求。为此,平头哥在研发过程中灵活调度了 30 种不同的 EDA 软件、深度定制时钟网络和定制 IP 技术。此外,他们还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。

倚天芯片的研制成功,标志着平头哥已经具备大型复杂芯片的研发设计能力,并进入与 Intel、AMD、AWS 等少数一流芯片公司竞争的行列。

从服务器芯片发布到玄铁处理器开源,阿里端云一体化战略逐渐清晰

除了在纵深向不断突破芯片技术外,平头哥也在积极推动芯片生态的发展。在本次云栖大会现场,平头哥宣布四款开源玄铁 RISC-V 系列处理器(玄铁 E902、E906、C906、C910),并开放相关工具及系统软件。开发者可通过平头哥 Github 和芯片开放社区(Open Chip Community)下载玄铁源代码,在此基础上,实现开源 EDA 协同,创新硬件架构,丰富软件应用生态。

这是继发布玄铁 710 等处理器后,平头哥在 RISC-V 生态上的重要举措,也是全球首个商业处理器的开源,进一步拉近了 RISC-V 技术与开发者的距离,成为全球硬件开源的新里程碑。

AIoT 时代,RISC-V 架构因其开放、灵活的特性,有望成为继 Intel X86、ARM 后的下一代广泛应用的 CPU 架构。但是,当前 RISC-V 架构面临应用碎片化、开发效率低、软硬件适配难等问题,软硬件生态尚未成熟。

玄铁 RISC-V 系列处理器采用自研技术,覆盖从低功耗到高性能的各类场景,支持 AliOS、FreeRTOS、RT-Thread、Linux、Android 等操作系统,并已成功应用于微控制器、工业控制、智能家电、智能电网、图像处理人工智能、多媒体和汽车电子等领域。不久前,玄铁 910 全球首次实现兼容安卓,极大拓展了 RISC-V 架构面向开放生态的想象力。

阿里表示,对于正在上升期的 RISC-V 架构技术而言,只有更多的开发者和企业使用,才能共同推进生态进步,真正让这一技术在芯片和操作系统等软硬件层面实现繁荣,平头哥也会从中受益。

服务器芯片发布、玄铁系列处理器宣布开源,阿里的端云一体化战略逐渐清晰。作为构筑这一战略的核心,达摩院、平头哥及阿里云,正在成为阿里巴巴三位一体的核心技术栈。平头哥得到了达摩院和阿里云的软实力加持,例如基于达摩院的算法能力,打破了算法和硬件之间的鸿沟;基于阿里云飞天云平台的优势,快速形成了端云一体芯片生态。
 
阿里表示,他们希望通过自研的强大技术平台和生态系统能力,推动国产自主芯片的产业化落地。
产业服务器芯片600亿颗晶体管5nm倚天710阿里平头哥芯片2021 云栖大会
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
寒武纪机构

寒武纪科技是一家AI芯片研发商。致力于打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片,同时还为用户提供IP授权、芯片服务、智能子卡和智能平台等服务。

www.cambricon.com
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

堆叠技术

堆叠泛化是一种用于最小化一个或多个泛化器的泛化误差率的方法。它通过推导泛化器相对于所提供的学习集的偏差来发挥其作用。这个推导的过程包括:在第二层中将第一层的原始泛化器对部分学习集的猜测进行泛化,以及尝试对学习集的剩余部分进行猜测,并且输出正确的结果。当与多个泛化器一起使用时,堆叠泛化可以被看作是一个交叉验证的复杂版本,利用比交叉验证更为复杂的策略来组合各个泛化器。当与单个泛化器一起使用时,堆叠泛化是一种用于估计(然后纠正)泛化器的错误的方法,该泛化器已经在特定学习集上进行了训练并被询问了特定问题。

阿里云机构

阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。 阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。 阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。 2014年,阿里云曾帮助用户抵御全球互联网史上最大的DDoS攻击,峰值流量达到每秒453.8Gb 。在Sort Benchmark 2016 排序竞赛 CloudSort项目中,阿里云以1.44$/TB的排序花费打破了AWS保持的4.51$/TB纪录。在Sort Benchmark 2015,阿里云利用自研的分布式计算平台ODPS,377秒完成100TB数据排序,刷新了Apache Spark 1406秒的世界纪录。 2018年9月22日,2018杭州·云栖大会上阿里云宣布成立全球交付中心。

https://www.aliyun.com/about?spm=5176.12825654.7y9jhqsfz.76.e9392c4afbC15r
阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。

https://www.alibabagroup.com/
AMD机构

超威半导体(中国)有限公司专门为计算机、通信和消费电子行业设计和制造各种创新的微处理器(CPU、GPU、主板芯片组、电视卡芯片等),以及提供闪存和低功率处理器解决方案,公司成立于1969年。AMD致力为技术用户——从企业、政府机构到个人消费者——提供基于标准的、以客户为中心的解决方案。

https://www.amd.com/zh-hans
推荐文章
暂无评论
暂无评论~