近日,最让半导体人关注的一件重磅大事就是英伟达斥资69亿美金收购以色列芯片厂商Mellanox这单交易。我们知道,英伟达是全球知名的GPU制造商,也是行业的领先者。而Mellanox则以InfiniBand和以太网产品线知名。双方的结合,按照官方的新闻稿的说法,通过这个收购,能将英伟达的加速计算平台与Mellanox全球知名的加速网络平台结合,共同创建新一代数据中心级解决方案。
当然,以上只是官方的一种说法,英伟达发起这单史上最大收购的背后,背后究竟包藏着多大的野心?让我们来试分析一下。
Mellanox为英伟达带来了什么?
首先从产品角度看;
Mellanox为服务器,存储和超融合基础设施提供包括以太网交换机,芯片和InfiniBand智能互连解决方案在内的大量的数据中心产品,根据英伟达的说法,这些产品被用于世界上一半以上最快的超级计算机和许多领先的超大规模数据中心。其中,更以InfiniBand互连,是这些产品中重点中的重点。俩字明尼苏达Nor-Tech的工程副总裁Dominic Daninger表示,InfiniBand互连对于相互连接的HPC工作负载变得至关重要。
Daninger进一步指出,InfiniBand互连是一种低延迟结构,它可以大大减少计算节点相互通信所需的时间。以对低延迟要求比较高的“HPC应用于计算流体动力学”为例。据介绍,如果多个节点各自在模拟中计算mesh中的不同部分,这就意味着一个节点中的变化将影响其他节点。一旦没有像InfiniBand这样的低延迟互连,那么这些节点需要更长的时间来进行通信更改。
另外,Ethernet产品线也是mellanox的另一优势所在。Gartner的HPC高级主管兼分析师Chirag Dekate在接受媒体采访的时候表示。Mellanox的两个产品线(Ethernet和InfiniBand)都支持RDMA(远程直接内存访问),能让集群(cluster)中的一个服务器在不涉及其操作系统的情况下,可以使用另一个服务器的内存(这是大型并行计算集群的关键功能)。同时,他们使用交换机处理器处理本来由CPU处理的网络操作任务。这样可以释放CPU容量来处理其他任务,并有助于避免大型集群中因“CPU-bound activity”过多导致的互连瓶颈。
其次从营收角度看;
按照国外分析机构Yole DeveloppementJean的首席执行官Jean-Christophe Eloy的说法,英伟通过收购Mellanox,可以一起去做同样的事。根据他的观点,英伟达有四分之一的营收是来自快速增长的数据中心市场,而Mellannox的加入,则可以帮忙扩大这种接入,并且为其现有产品线扩展新的渠道。
英伟达表示,未来的数据中心将被构建为拥有数万个计算节点的巨型计算引擎,并通过其互连设计整体,以实现最佳性能。 随着英伟达的GPU与Mellanox的互连相结合,数据中心工作负载将在整个计算,网络和存储堆栈中进行优化,并能实现更高的性能,更高的利用率和更低的运营成本。按照英伟达的说法,Mellanox产品说聚焦的市场规模约为110亿美元,这大大拓展了他们的盘子。
而Mellanox在这个市场表现也很不错。他们在今年1月的一次演讲中表示,全球六大银行中的五家,十大石油和天然气公司中的九家,前五大制药公司中的三家以及十大汽车制造商都使用Mellanox解决方案。
而根据彭博社的估计,Mellanox今年的净利润将增加一倍以上,这将抵消英伟达因为加密货币冷淡带来的核心业务增长放缓的影响。根据数据,2018年(2019财年),英伟达的收入为117.2 亿美元,Mellanox的营收为11亿美元。
这对数据中心市场意味着什么?
在加密货币大败退之后,数据中心俨然已经成为了英伟达紧盯的新目标,而这部分业务也的确没有让英伟达失望。
数据显示,2019财年,数据中心业务是英伟达成长最快的业务,在该财年,为英伟达贡献了29亿美元的营收(约为总营业额的25%),与2018年相比,同比增长了52%。作为对比,我们可以看到英伟达的专业可视化业务在2019年每年增长21%,达到11亿美元,而汽车解决方案销售额增长15%,达到6.41亿美元。而该公司最大的业务部门Gaming增长了13%,达到62亿美元。
然而数据中心市场正在发生变化。
一方面,为了分析数据以获取更深入的见解,数据中心正在逐渐远离公司存储数据的地方。与此同时,越来越多的人通过人工智能,机器学习和深度学习技术对数据进行分析。这就驱使企业都需要使用类似超级计算机的架构来设计他们的数据中心,而这恰好是英伟达和Mellanox说擅长的领域所在。
另一方面,数据中心的应用也发生了变化。过去,应用只是在一个服务器上运行。但现在,由于虚拟机和容器(containers)等的流行,应用程序在多台计算机上运行,这就是为什么数据中心的东西向流量爆炸的原因,而Mellanox正是解决相关问题的专家。
在收购完成之后,英伟达拥有了一个应用于深度学习,HPC和大数据分析的计算堆栈。这一组合将使其在超大规模云平台和其他云原生公司中取得成功,但如果想使其适合更传统的企业,英伟达将不得不做出更多的努力。
双方的联手,对于数据中心来说,也是非常有意义的。
英伟达让“盒子”里的东西更快,Mellanox在“盒子”之间做同样的事情。展望未来,合并的新公司或者会带来一种数据处理和互连技术集成的数据中心,而英伟达现在已经在较小的规模上做到了这一点。其NVLink结构最多可连接8个GPU,在服务器内有效创建单个GPU结构。
按照英伟达首席执行官黄仁勋的说法,这是公司的“X因素”。该技术让英伟达能够将X因素扩展到开箱即用,使数据中心看起来像是一个解决高性能要求的大型处理架构。
英特尔成为最大的受害者?
在之前英特尔竞标Mellanox的时候,就有媒体分析过,如果英特尔收购成功,对英伟达来说还是一个坏消息。因为虽然英伟达在NVLink和NVSwitch拥有自己强大的互连技术,但这主要用于扩展计算架构(处理能力在单一系统内增加),然而使用Mellanox的技术,可以实现横向扩展架构(其中通过向计算“结构”添加更多服务器节点来增加处理能力)。
但现在英伟达以9亿美元的优势买下Mellanox之后(有消息称英特尔的开价为60亿美金),形势完全逆转了。虽然英特尔拥有自己的横向扩展互联技术Omni-Path。但与InfiniBand和Ethernet相比,Omni-Path在HPC互连领域的市场份额很小。对于深度学习硬件系统的构建者来说,Omni-Path也没什么吸引力。同时,在速度上,Omni-Path也远远落后于前两者。
通过Mellanox,英伟达将拥有更广泛的产品组合,可以销售给CSP和服务器供应商。对于绝大多数市场来说,这是一个好兆头。AMD可能不会在其AMD EPYC或GPU服务器中使用英伟达品牌的Mellanox NIC(他们现在使用Intel的),但毫无疑问,前者将是最好的选择。
为了扭转这一局势,英特尔也在这单交易宣布的当天早上正式对外宣布,他们正在开发一种名为Compute Express Link(CXL)的新型开放式互连技术。按照英特尔介绍,这一新行业标准目的是提供突破性的数据中心性能,帮助计算机跟上物联网时代数据爆炸的步伐。消除CPU与数据中心专用加速芯片(如GPU,FPGA和网络))之间的瓶颈。这与mellanox的做法不谋而合。
在摩尔定律放缓与数据工作负载大小也随着机器学习等部署的计算需求而增长的前提下,曾经由英特尔服务器和大型存储系统主导数据中心正在快速变化,应用程序的发展和人工智能的兴起使连接和GPU处于最前沿。
通过这单交易,让他们在数据中心的位置越来越重要。而在笔者看来,企业CIO应该将此作为AI和ML接近主流的信号,他们应该认真考虑革新自己的数据中心了。
参考来源:
https://www.eweek.com/pc-hardware/why-英伟达-mellanox-will-change-future-of-data-center
https://www.datacenterknowledge.com/deals/英伟达-7-billion-what-it-takes-dominate-ai-hardware
https://www.servethehome.com/英伟达-to-acquire-mellanox-a-potential-prelude-to-servers/