Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

张倩报道

最新全球TOP 500超算排行榜公布:ARM首次登顶,2/3超算由英伟达加持

北京时间 6 月 22 日晚,新一期全球超级计算机 TOP 500 榜单公布:使用数颗 48 核 ARM 芯片的日本 Fugaku(富岳)超级计算机夺得榜首,这是 ARM 架构首次登顶超算 TOP 500 榜单。此外,榜单中三分之二的超算都使用了英伟达的 GPU 或 InfiniBand 网络技术。

TOP 500 榜单始于 1993 年,每半年发布一次,是给全球已部署的超级计算机计算速度排名的知名榜单。

在过去的几年中,中国和美国的超级计算机轮流占领榜首。在最近的一次排名中,IBM 为美国橡树岭国家实验室打造的 “Summit” 超级计算机稳居王座。

Fugaku 的出现打破了这一局面。这台超级计算机由神户市理研计算科学中心和富士通联合开发,峰值计算速度达 513.9 petaflops(每秒 513.9 千万亿次计算),是第二名 Summit 的 2.6 倍;Linpack(HPL)结果达到 415.5 petaflops,是 Summit 的 2.8 倍。

进入榜单前十名的超级计算机还包括美国加州劳伦斯利弗莫尔国家实验室的 Sierra、中国国家超级计算无锡中心的神威太湖之光、中国国家超级计算广州中心的“天河 2A”、意大利能源公司 Eni S.p.A 的 HPC5、美国英伟达公司的 Selene、美国得克萨斯高级计算中心的 Frontera、意大利 CINECA 研究中心的 Marconi-100 以及瑞士国家超级计算中心的 Piz Daint。


在上榜数量方面,中国稳居第一,榜单上的 226 台超算都来自中国;美国位居第二,贡献了榜单上的 114 台超算。

但在上榜计算机性能总和(aggregate list performance )指标中,美国位列第一,达 644 petaflops;中国则为 565 petaflops,位列第二。

在企业方面,来自中国的制造商贡献最大,榜单上的 312 台超算来自联想(180)、中科曙光(68)、浪潮(64)三家中国企业。占 TOP 500 份额的 62%。

ARM 架构首次登顶超算 TOP 500

与之前登顶 TOP 500 的超算相比,Fugaku 最大的特点之一是使用了基于 ARM 架构的 CPU。这也是 ARM 架构处理器首次登顶超算 TOP 500 榜首,彰显了该架构在高性能计算领域的潜力。巧合的是,几乎在 TOP 500 新榜出炉的同一时间,苹果 CEO 库克在 WWDC20 发布会上表示,苹果电脑 MAC 将使用自研的 ARM 架构芯片,逐步替代现有的英特尔芯片。

Fugaku 使用的是富士通 48 核 ARM 处理器 A64FX(一款定制的 Arm v8 架构芯片),浮点部分是与 ARM 合作的 SVE 指令扩展,使用了 512bit 浮点运算单元,每个节点使用 48 核 + 4 辅助核,IO 及计算节点则是 48 核 + 4 辅助核结构。

A64FX 也支持较低精度的量化模型。在处理单精度运算或更低精度的运算时(通常应用在机器学习和 AI 领域),Fugaku 的峰值性能可以超过 1000petaflops。目前,这台超级计算机安装在日本神户理研计算科学中心,可以想象一下用它来训练神经网络是一种怎样的体验。

虽然 Fugaku 已经成为全球最强超算,但 TOP 500 的官方统计显示,x86 架构仍然是 TOP 500 超算的主流选择,占到了 481 台。相比之下,ARM 处理器只占 4 台,其中 3 台搭载了富士通 A64FX,另外 1 台搭载的是 Marvell 的 ThunderX2。

2/3 TOP 500 超算都有英伟达技术加持

除了 ARM,此次的 TOP 500 新榜还有一位最大赢家——英伟达。

在这 500 台超算中,144 台都用到了加速器或协处理器,而其中的 135 台都用到了英伟达的 GPU,超过榜单的 1/4。

如果算上英伟达 4 月份收购的 Mellanox,英伟达在榜单上的分量将变得更重。Mellanox 一直致力于 InfiniBand 和以太网互联产品的研发工作,今年 4 月被英伟达以 70 亿美元的价格收购。在排名前十的超级计算机中,有 8 台都采用了 NVIDIA GPU、InfiniBand 网络技术或二者兼有。其中包括美国、欧洲和中国最强大的超级计算机系统。

而在整个 TOP 500 榜单中,有英伟达 GPU 或 InfiniBand 加持的超算达到了 333 台。与 2017 年相比,这一数字增长了 64%。

在能效方面,使用 NVIDIA GPU 的系统表现也都脱颖而出。与不使用 NVIDIA GPU 的系统相比,其能效(以 gigaflops/watt 为单位)平均高出 1.8 倍。这也是为何排在 TOP500 榜单前 25 的超级计算机中有 20 台系统都选择采用 NVIDIA GPU 的原因之一。

最能够证明此能效表现的是 NVIDIA 内部研究集群的新成员—— Selene。Selene 包含 280 个 DGX A100,2240 块 NVIDIA A100 GPU,在 Linpack 基准测试中以 27.5  petaflops 的性能表现,在最新 Green500 榜单中排名第二,在整个 TOP500 榜单中排名第七(Green500 旨在发布全球范围内最绿色节能的高性能计算机群,通过测量与能耗相关的性能来对最绿色节能的超级计算机进行评级)。


Selene 的功耗为 20.5 gigaflops/watt,与 Green500 榜单上的第一名相差甚微,但排名第一的系统体积更小,其性能表现仅排在第 394 位。

Selene 是排名前 100 的系统中唯一突破 20 gigaflops/watt 能效表现大关的系统,同时也是全球性能排名第二的工业超级计算机,仅次于意大利能源巨头 Eni S.p.A. 的 No. 6 系统(同样使用了 NVIDIA GPU)。

在能效方面,相比于未使用 NVIDIA GPU 的其它 TOP500 系统的平均能效表现,Selene 的能效高出了 6.8 倍。Selene 的优异性能和能效均要归功于 NVIDIA A100 GPU 中的第三代 Tensor Core 核心。该核心可以为传统的 64 位数学模拟及精度较低的 AI 工作提供加速。

目前,这些超级计算机已经用到了气候预测、交通、地震预警、分子筛选等多个领域。疫情期间,“天河 2 号”曾协助搭建起了 15 秒断诊的新冠 CT 影像智能诊断平台,并且还助力筛选针对新冠病毒的小分子药物。而最新登顶的 Fugaku 也被用来在数千种现有药物中寻找能够有效治疗新冠的候选药物。

参考链接:
https://www.top500.org/news/japan-captures-top500-crown-arm-powered-supercomputer/
https://www.anandtech.com/show/15869/new-1-supercomputer-fujitsus-fugaku-and-a64fx-take-arm-to-the-top-with-415-petaflops
入门超算ARM英伟达
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

联想集团机构

联想集团是1984年中国科学院计算技术研究所投资20万元人民币,由11名科技人员创办,是中国的一家在信息产业内多元化发展的大型企业集团,和富有创新性的国际化的科技公司。 从1996年开始,联想电脑销量一直位居中国国内市场首位;2005年,联想集团收购IBM PC(Personal computer,个人电脑)事业部;2013年,联想电脑销售量升居世界第一,成为全球最大的PC生产厂商。2014年10月,联想集团宣布了该公司已经完成对摩托罗拉移动的收购。 作为全球电脑市场的领导企业,联想从事开发、制造并销售可靠的、安全易用的技术产品及优质专业的服务,帮助全球客户和合作伙伴取得成功。联想公司主要生产台式电脑、服务器、笔记本电脑、智能电视、打印机、掌上电脑、主板、手机、一体机电脑等商品。 自2014年4月1日起, 联想集团成立了四个新的、相对独立的业务集团,分别是PC业务集团、移动业务集团、企业级业务集团、云服务业务集团。2016年8月,全国工商联发布“2016中国民营企业500强”榜单,联想名列第四。 2018年12月,世界品牌实验室编制的《2018世界品牌500强》揭晓,排名第102。

推荐文章
暂无评论
暂无评论~