Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Nvidia为什么收购Mellanox?这篇说透了

近日,最让半导体人关注的一件重磅大事就是英伟达斥资69亿美金收购以色列芯片厂商Mellanox这单交易。我们知道,英伟达是全球知名的GPU制造商,也是行业的领先者。而Mellanox则以InfiniBand和以太网产品线知名。双方的结合,按照官方的新闻稿的说法,通过这个收购,能将英伟达的加速计算平台与Mellanox全球知名的加速网络平台结合,共同创建新一代数据中心级解决方案。

当然,以上只是官方的一种说法,英伟达发起这单史上最大收购的背后,背后究竟包藏着多大的野心?让我们来试分析一下。

Mellanox为英伟达带来了什么?

首先从产品角度看;

Mellanox为服务器,存储和超融合基础设施提供包括以太网交换机,芯片和InfiniBand智能互连解决方案在内的大量的数据中心产品,根据英伟达的说法,这些产品被用于世界上一半以上最快的超级计算机和许多领先的超大规模数据中心。其中,更以InfiniBand互连,是这些产品中重点中的重点。俩字明尼苏达Nor-Tech的工程副总裁Dominic Daninger表示,InfiniBand互连对于相互连接的HPC工作负载变得至关重要。

Daninger进一步指出,InfiniBand互连是一种低延迟结构,它可以大大减少计算节点相互通信所需的时间。以对低延迟要求比较高的“HPC应用于计算流体动力学”为例。据介绍,如果多个节点各自在模拟中计算mesh中的不同部分,这就意味着一个节点中的变化将影响其他节点。一旦没有像InfiniBand这样的低延迟互连,那么这些节点需要更长的时间来进行通信更改。

另外,Ethernet产品线也是mellanox的另一优势所在。Gartner的HPC高级主管兼分析师Chirag Dekate在接受媒体采访的时候表示。Mellanox的两个产品线(Ethernet和InfiniBand)都支持RDMA(远程直接内存访问),能让集群(cluster)中的一个服务器在不涉及其操作系统的情况下,可以使用另一个服务器的内存(这是大型并行计算集群的关键功能)。同时,他们使用交换机处理器处理本来由CPU处理的网络操作任务。这样可以释放CPU容量来处理其他任务,并有助于避免大型集群中因“CPU-bound activity”过多导致的互连瓶颈。

其次从营收角度看;

按照国外分析机构Yole DeveloppementJean的首席执行官Jean-Christophe Eloy的说法,英伟通过收购Mellanox,可以一起去做同样的事。根据他的观点,英伟达有四分之一的营收是来自快速增长的数据中心市场,而Mellannox的加入,则可以帮忙扩大这种接入,并且为其现有产品线扩展新的渠道。

英伟达表示,未来的数据中心将被构建为拥有数万个计算节点的巨型计算引擎,并通过其互连设计整体,以实现最佳性能。 随着英伟达的GPU与Mellanox的互连相结合,数据中心工作负载将在整个计算,网络和存储堆栈中进行优化,并能实现更高的性能,更高的利用率和更低的运营成本。按照英伟达的说法,Mellanox产品说聚焦的市场规模约为110亿美元,这大大拓展了他们的盘子。

而Mellanox在这个市场表现也很不错。他们在今年1月的一次演讲中表示,全球六大银行中的五家,十大石油和天然气公司中的九家,前五大制药公司中的三家以及十大汽车制造商都使用Mellanox解决方案。

而根据彭博社的估计,Mellanox今年的净利润将增加一倍以上,这将抵消英伟达因为加密货币冷淡带来的核心业务增长放缓的影响。根据数据,2018年(2019财年),英伟达的收入为117.2 亿美元,Mellanox的营收为11亿美元。

这对数据中心市场意味着什么?

在加密货币大败退之后,数据中心俨然已经成为了英伟达紧盯的新目标,而这部分业务也的确没有让英伟达失望。

数据显示,2019财年,数据中心业务是英伟达成长最快的业务,在该财年,为英伟达贡献了29亿美元的营收(约为总营业额的25%),与2018年相比,同比增长了52%。作为对比,我们可以看到英伟达的专业可视化业务在2019年每年增长21%,达到11亿美元,而汽车解决方案销售额增长15%,达到6.41亿美元。而该公司最大的业务部门Gaming增长了13%,达到62亿美元。

然而数据中心市场正在发生变化。

一方面,为了分析数据以获取更深入的见解,数据中心正在逐渐远离公司存储数据的地方。与此同时,越来越多的人通过人工智能机器学习深度学习技术对数据进行分析。这就驱使企业都需要使用类似超级计算机的架构来设计他们的数据中心,而这恰好是英伟达和Mellanox说擅长的领域所在。

另一方面,数据中心的应用也发生了变化。过去,应用只是在一个服务器上运行。但现在,由于虚拟机和容器(containers)等的流行,应用程序在多台计算机上运行,这就是为什么数据中心的东西向流量爆炸的原因,而Mellanox正是解决相关问题的专家。

在收购完成之后,英伟达拥有了一个应用于深度学习,HPC和大数据分析的计算堆栈。这一组合将使其在超大规模云平台和其他云原生公司中取得成功,但如果想使其适合更传统的企业,英伟达将不得不做出更多的努力。

双方的联手,对于数据中心来说,也是非常有意义的。

英伟达让“盒子”里的东西更快,Mellanox在“盒子”之间做同样的事情。展望未来,合并的新公司或者会带来一种数据处理和互连技术集成的数据中心,而英伟达现在已经在较小的规模上做到了这一点。其NVLink结构最多可连接8个GPU,在服务器内有效创建单个GPU结构。

按照英伟达首席执行官黄仁勋的说法,这是公司的“X因素”。该技术让英伟达能够将X因素扩展到开箱即用,使数据中心看起来像是一个解决高性能要求的大型处理架构。

英特尔成为最大的受害者?

在之前英特尔竞标Mellanox的时候,就有媒体分析过,如果英特尔收购成功,对英伟达来说还是一个坏消息。因为虽然英伟达在NVLink和NVSwitch拥有自己强大的互连技术,但这主要用于扩展计算架构(处理能力在单一系统内增加),然而使用Mellanox的技术,可以实现横向扩展架构(其中通过向计算“结构”添加更多服务器节点来增加处理能力)。

但现在英伟达以9亿美元的优势买下Mellanox之后(有消息称英特尔的开价为60亿美金),形势完全逆转了。虽然英特尔拥有自己的横向扩展互联技术Omni-Path。但与InfiniBand和Ethernet相比,Omni-Path在HPC互连领域的市场份额很小。对于深度学习硬件系统的构建者来说,Omni-Path也没什么吸引力。同时,在速度上,Omni-Path也远远落后于前两者。

通过Mellanox,英伟达将拥有更广泛的产品组合,可以销售给CSP和服务器供应商。对于绝大多数市场来说,这是一个好兆头。AMD可能不会在其AMD EPYC或GPU服务器中使用英伟达品牌的Mellanox NIC(他们现在使用Intel的),但毫无疑问,前者将是最好的选择。

为了扭转这一局势,英特尔也在这单交易宣布的当天早上正式对外宣布,他们正在开发一种名为Compute Express Link(CXL)的新型开放式互连技术。按照英特尔介绍,这一新行业标准目的是提供突破性的数据中心性能,帮助计算机跟上物联网时代数据爆炸的步伐。消除CPU与数据中心专用加速芯片(如GPU,FPGA和网络))之间的瓶颈。这与mellanox的做法不谋而合。

摩尔定律放缓与数据工作负载大小也随着机器学习等部署的计算需求而增长的前提下,曾经由英特尔服务器和大型存储系统主导数据中心正在快速变化,应用程序的发展和人工智能的兴起使连接和GPU处于最前沿。

通过这单交易,让他们在数据中心的位置越来越重要。而在笔者看来,企业CIO应该将此作为AI和ML接近主流的信号,他们应该认真考虑革新自己的数据中心了。  

参考来源:

https://www.eweek.com/pc-hardware/why-英伟达-mellanox-will-change-future-of-data-center

https://www.datacenterknowledge.com/deals/英伟达-7-billion-what-it-takes-dominate-ai-hardware

https://www.servethehome.com/英伟达-to-acquire-mellanox-a-potential-prelude-to-servers/

半导体行业观察
半导体行业观察

最有深度的半导体新媒体,实时、专业、原创、深度,30万半导体精英关注!专注观察全球半导体最新资讯、技术前沿、发展趋势。

产业英伟达Mellanox收购
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

导数技术

导数(Derivative)是微积分中的重要基础概念。当函数y=f(x)的自变量x在一点x_0上产生一个增量Δx时,函数输出值的增量Δy与自变量增量Δx的比值在Δx趋于0时的极限a如果存在,a即为在x0处的导数,记作f'(x_0) 或 df(x_0)/dx。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

摩尔定律技术

摩尔定律是由英特尔创始人之一戈登·摩尔提出来的。其内容为:积体电路上可容纳的电晶体数目,约每隔两年便会增加一倍;经常被引用的“18个月”,是由英特尔首席执行官大卫·豪斯所说:预计18个月会将芯片的性能提高一倍。

分析机技术

分析机是由英国数学家查尔斯·巴贝奇设计的一种机械式通用计算机。从1837年首次提出这种机器的设计,一直到他去世的1871年,由于种种原因,这种机器并没有被真正的制造出来。但它本身的设计逻辑却十分先进,是大约100年后电子通用计算机的先驱。

物联网技术技术

物联网(英语:Internet of Things,缩写IoT)是互联网、传统电信网等信息承载体,让所有能行使独立功能的普通物体实现互联互通的网络。物联网一般为无线网,而由于每个人周围的设备可以达到一千至五千个,所以物联网可能要包含500兆至一千兆个物体。在物联网上,每个人都可以应用电子标签将真实的物体上网联结,在物联网上都可以查出它们的具体位置。通过物联网可以用中心计算机对机器、设备、人员进行集中管理、控制,也可以对家庭设备、汽车进行遥控,以及搜索位置、防止物品被盗等,类似自动化操控系统,同时通过收集这些小事的数据,最后可以聚集成大数据,包含重新设计道路以减少车祸、都市更新、灾害预测与犯罪防治、流行病控制等等社会的重大改变,实现物和物相联。

推荐文章
暂无评论
暂无评论~