Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

成立三年被英特尔20亿美元收购,这家以色列AI芯片公司做对了什么

成立三年被<mark data-type=institutions data-id=3437dab4-c82a-453e-8dd9-46a27001ab4f>英特尔</mark>20亿美元收购,这家以色列AI芯片公司做对了什么

北京时间 12 月 16 日,英特尔收购 Habana Labs 的传闻被敲定,此次收购仍延续着英特尔「大手大脚」的作风——20 亿美元,重金投掷。

Habana Labs 成立于 2016 年,成立时间虽短,但却「后生可畏」,它是目前在人工智能芯片领域实现量产的为数不多的创业公司,目前以推出针对 AI 和机器学习工作负载的硅产品:Gaudi AI Training Processor 和 Goya AI Inference Processor。

20 亿美元背后,是在市场如英伟达、AMD、高通等企业的「群狼环伺」下,英特尔在 AI 技术大本营的精心布局,这些完整的、广泛适用的软硬件技术生态,终将为英特尔稳固并开拓更多市场。

撰文 | 凡雪、蛋酱

12 月初,外媒报道芯片制造商英特尔正洽谈收购以色列 AI 芯片制造商 Habana Labs 事宜,传闻很快得到印证,北京时间 12 月 16 日,英特尔表示以约 20 亿美元收购 Habana Labs。

这将是英特尔在以色列仅次于 Mobileye 第二大收购。

英特尔预计,2024 年 AI 芯片市场规模将超过 250 亿美元,在一份声明中,英特尔宣称,这次交易将强化英特尔人工智能解决方案,进一步推动公司在新生的、快速增长的 AI 芯片市场的份额。

英特尔表示,收购后 Habana Labs 仍将是一个独立的业务部门,继续由其目前的管理团队领导,向英特尔的数据平台集团汇报,Habana Labs 董事长阿维格多. 威伦茨 (Avidor Willenz) 已同意担任该业务部门以及英特尔的高级顾问,公司总部继续设在以色列。

据悉,Habana Labs 由 3D 传感器创业公司 PrimeSense 两位前高管于 2016 年创立,PrimeSence 于 2013 年被苹果以 3.6 亿美元收购。公司致力于提高人工智能芯片的处理性能并降低成本和功耗,其开发的人工智能芯片主要用于深度神经网络训练等特定需求。

1 20亿美元被收购,Habana Labs 「做对」了什么?

未被收购前,Habana Labs 与英特尔已有一段渊源。

2018 年 11 月,Habana Labs 获得由英特尔投资部门领投的 7500 万美元 B 轮融资,截至收购前,Habana Labs 总计融资约 1.2 亿美元,

Habana Labs 成立于 2016 年,是一家为数据中心提供可编程深度学习加速器的厂商,总部位于以色列,在波兰格但斯克设有研发中心,根据官方信息,其在以色列、波兰、美国加州圣何塞、 北京共有约 150 名员工。

在业务上,Habana 提供两种针对 AI 和机器学习工作负载的硅产品:Gaudi AI Training Processor 和 Goya AI Inference Processor。

据悉,Gaudi 是 Habana 用于加速训练的微体系结构。运用 TSMC 16 纳米工艺设计,该芯片将八个 TCP 与 GEMM 引擎集成在一个集群中。由于 Gaudi 是根据 Goya 设计的,因此 Habana 确实设法植入了一些新功能。就支持的数据类型而言,随着行业将 bfloat16 作为训练的首选数据类型,Habana 在 Gaudi 中增加了对其的支持。Habana 说,在 TPC 和 GEMM 引擎中,它添加了 ISA 的一些新功能和硬件功能,以帮助加速某些较新的算法。

成立三年被<mark data-type=institutions data-id=3437dab4-c82a-453e-8dd9-46a27001ab4f>英特尔</mark>20亿美元收购,这家以色列AI芯片公司做对了什么


Habana 提供两种尺寸的 HL-2000 Gaudi 芯片:OCP 加速器模块和标准 PCIe 卡。两种尺寸都包含 32 GiB 的 HBM2 存储器,总带宽为 1 TB / s。

Guadi 将与英特尔的 Nervana Neural Net L-1000(代号 Spring Crest)一起使用,后者针对图像识别进行了优化,并且其架构与其他芯片不同,因为它缺乏标准的缓存层次结构和片上内存由软件直接管理。(英特尔先前声称 NNP-T 的 24 个计算群集,32GB 的 HBM2 堆栈和本地 SRAM 的 AI 培训性能是同类显卡的 10 倍。)

Goya 是 Habana 的微体系结构,用于加速推理。Goya 采用台积电(TSMC)16 纳米工艺制造,而这个产品实际上是 Gaudi 的简化版本。芯片的两个主要组件是 TPC(Tensor Processor Core:张量处理器内核)和 GEMM(通用矩阵乘法:general matrix multiply)引擎。TPC 是该公司基于 VLIW SIMD 的 CPU / DSP 设计。这些内核基于自定义的 VLIW ISA,该功能具有专门的 AI SIMD 矢量指令。

Habana 试水 TPC 的目的之一就是提高灵活性。这些内核是完全可编程的,它们可以实现任何必要的 AI 功能,并且支持包括 8 位,16 位和 32 位整数和浮点运算在内的整个混合精度数据类型。完整的 Goya 芯片具有一个集群中的八个 TPC。该芯片与 TPC 集群一起集成了强大的 GEMM(通用矩阵乘法)引擎,此外,TPC 没有本地缓存,它们具有本地暂存器块以及 GEMM 引擎和 TPC 共享的大型共享内存。

Goya 推理芯片 HL-1000 被封装在 PCIe Gen 4 加速卡中。提供了两个 SKU、所提供的冷却类型有被动和主动、卡存储容量之间的差异在 4 到 16 GiB 之间。Habana 说,卡的最大 TDP 为 200 W,但我们可以预期典型功耗通常仅为该值的一半。

Goya 将补充英特尔内部代号为 Springhill 的 Nervana NNP-I,该处理器基于 10 纳米 Ice Lake 处理器,将使其能够以最少的能耗应对高工作量。

人工智能推理处理器已实现商用,它在吞吐量和延迟方面都比Nvidia芯片提供多达3倍的AI推理性能。随着人工智能工作负载的不断增加,对计算、内存和连接的要求也越来越高。Goya将补充英特尔内部代号为Springhill的Nervana NNP-I,该处理器基于10纳米Ice Lake处理器,将使其能够以最少的能耗应对高工作量。

成立三年被<mark data-type=institutions data-id=3437dab4-c82a-453e-8dd9-46a27001ab4f>英特尔</mark>20亿美元收购,这家以色列AI芯片公司做对了什么


据了解,目前,Gaudi HL-2000 训练芯片正在提供样品,Goya HL-1000 推理芯片已经交付了将近一年,Habana 已经在着手开发其下一代推理和训练芯片,该芯片将转移到 7 纳米工艺进行。

Gaudi 训练产品和 Goya 推理产品可以提供一个丰富的、易于编程的开发环境,帮助英特尔部署差异化解决方案。

在软件方面,Habana 提供了一个开发和执行环境 SynapseAI,该环境具有库和 JIT 编译器,旨在帮助客户将解决方案部署为 AI 工作负载,值得一提的是,它支持所有标准的 AI 和机器学习框架(例如 Google 的 TensorFlow 和 Facebook 的 PyTorch),以及由 Microsoft,IBM华为高通,AMD,Arm 等倡导的 Open Neural Network Exchange 格式。

Habana Labs 虽然创立仅 3 年时间,但确实是目前在生产型人工智能芯片领域实现量产的创业公司。英特尔收购 Habana Labs,显然是看中了其在人工智能计算市场的巨大潜力,Habana 的过硬的软硬件实力也让这次收购变得顺理成章。

英特尔数据平台事业部执行副总裁兼总经理孙纳颐(Navin Shenoy)认为:「此次收购推进了我们的人工智能战略,具体来说,通过高性能训练处理器系列产品和基于标准的编程环境,Habana Labs 大大增强了我们数据中心人工智能产品实力,以应对不断变化的人工智能行业。

2 群雄逐鹿,Habana能否为英特尔攻下芯片一城

此次收购 Habana,并不是英特尔第一次「大手大脚」花钱,过去的几年里,英特尔在芯片领域布局不断。

英特尔收购Habana是在2016年9月收购了总部位于圣马特奥的Movidius(设计用于计算机视觉的专用低功耗处理器芯片)之后。英特尔 于2015 年收购了现场可编程门阵列(FPGA)制造商Altera, 一年后收购 Nervana填写了其硬件平台产品,并为新一代AI加速器芯片组奠定了基础。8月,英特尔抢购了Vertex.ai,这是一家开发平台无关的AI模型套件的初创公司。

2015 年 6 月,英特尔以 167 亿美元收购可编程芯片厂商 Altera,这笔交易成为当时英特尔历史上金额最大的一笔收购,被视为英特尔加速摆脱 PC 业务依赖的重要标志。Altera 在 FPGA 技术领域处于领先地位,这种技术在海量运算中具备独特价值,基于 FPGA 的云计算性能可以比处理器高出 10 到 100 倍。在完成对 Altera 的收购后,英特尔在 FPGA 技术方面的研发投入也大幅增加,正式将 FPGA 芯片纳入自身产品线。

2016年8月,英特尔又以 4.08 亿美元的价格收购了深度学习技术初创公司Nervana。Nervana创立于2014年,主攻半导体,软件和AI深度学习技术。收购之后,英特尔利用Nervana在软件、云计算服务和硬件等方面的优势,提升自身在人工智能计算任务方面的处理能力。这也是英特尔人工智能时代面对英伟达等竞争对手的重要动作。

仅仅一个月后,2016 年 9 月,英特尔宣布收购计算机视觉处理初创公司 Movidius。Movidius 成立于 2006 年,早期集中于 3D 电影业务,后期开始涉足 3D 渲染芯片的开发,曾被《麻省理工科技评论》评为 2016 年「50 大创新公司」之一。

Movidius 拥有低功耗、高表现力的杀手级产品「Myriad」系列视觉处理器,也是大疆无人机的芯片供应商。在被英特尔收购前,谷歌、联想三星等科技巨头都曾向 Movidius 抛出过橄榄枝,最终英特尔将 Movidius 收入囊中。

2018 年 8 月,英特尔又一次收购深度学习技术领域的初创公司 Vertex.ai。Vertex.ai 是一家开发深度学习编译工具及配套技术的西雅图公司,收购完成后,Vertex.ai 的 7 人团队加入了英特尔 AI 产品集团的 Movidius 团队,推进边缘计算的灵活深度学习等相关研究工作。

频繁布局背后,是英特尔想要在快速增长且变量大的芯片市场中站稳脚跟的野心。根据预测,2019 年英特尔人工智能业务带动的收入将超过 35 亿美元,同比增长 20% 以上;到 2024 年,这一市场规模将超过 250 亿美元。

英特尔目前的战略是以数据为中心,AI 作为其中非常关键的一部分,英特尔已拥有从 CPU、GPU、FPGA 到 ASIC 的 AI 芯片,在各个领域收编并发展先进的人工智能技术,将其组合成完整的、广泛适用的软硬件技术生态,最终构成英特尔数据中心 AI 技术大本营,为英特尔稳固并开拓更多市场。

正如英特尔副总裁兼架构总经理 Gadi Singer 所言:「人工智能硬件是一个价值数十亿美元的商机。我们会投资几个产品线,因为该领域的需求非常广泛。其中一些产品(比如加速器等)将侧重于节能,这是这些产品独有的特点。因此,投资这个领域可以让我们的投资组合相辅相成。」

除了行业潜力和本身业务线原因,芯片市场的竞争程度也不可小觑。英伟达(Nvidia)、高通、迈威尔(Marvell)和 AMD 等公司带来的竞争日益加剧;Hailo 科技公司、GraphcoreWave Computing、Esperanto 和 Quadric 等创业公司也加入了这场角逐,甚至连亚马逊也有可能威胁到英特尔的收益,因此,英特尔必须在该领域加足马力,逐一高下。

收购 Nervana 三年后,今年11月,英特尔推出了首款云端AI专用芯片 Nervana 神经网络处理器(NNP)系列产品,旨在加速深度学习框架的性能,但是 NNP-I 的量产仍然任重道远,在业界人士看来,这次收购 Habana 也变相佐证此前收购Nervana 结构不尽如人意。

2017 年,英特尔曾以 153 亿美金收购以色列自动驾驶技术公司 Mobileye,并凭此成为车载人工智能市场的主要玩家。此次收购 Habana Labs,英特尔也怀着同样的愿景,希望增强其在数据中心市场的竞争力,然而 Habana 能否带着英特尔 AI 技术大本营冲出重围,在 AI 芯片领域分得一杯羹,仍未可知,不过此次收购也不失为是一种减少潜在竞争对手的策略。

产业英特尔AI芯片
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
Qualcomm机构

高通公司(英语:Qualcomm,NASDAQ:QCOM)是一个位于美国加州圣地亚哥的无线电通信技术研发公司,由加州大学圣地亚哥分校教授厄文·马克·雅克布和安德鲁·维特比创建,于1985年成立。两人此前曾共同创建Linkabit。 高通公司是全球3G、4G与5G技术研发的领先企业,目前已经向全球多家制造商提供技术使用授权,涉及了世界上所有电信设备和消费电子设备的品牌。根据iSuppli的统计数据,高通在2007年度一季度首次一举成为全球最大的无线半导体供应商,并在此后继续保持这一领导地位。其骁龙移动智能处理器是业界领先的全合一、全系列移动处理器,具有高性能、低功耗、逼真的多媒体和全面的连接性。目前公司的产品和业务正在变革医疗、汽车、物联网、智能家居、智慧城市等多个领域。

http://www.qualcomm.com/
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

张量处理器技术

张量处理器(英语:tensor processing unit,缩写:TPU)是Google为机器学习定制的专用芯片(ASIC),专为Google的深度学习框架TensorFlow而设计。 与图形处理器(GPU)相比,TPU采用低精度(8位)计算,以降低每步操作使用的晶体管数量。降低精度对于深度学习的准确度影响很小,但却可以大幅降低功耗、加快运算速度。同时,TPU使用了脉动阵列的设计,用来优化矩阵乘法与卷积运算,减少I/O操作。此外,TPU还采用了更大的片上内存,以此减少对DRAM的访问,从而更大程度地提升性能。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

Graphcore拟未机构

Graphcore拟未为人工智能打造计算机系统,由先进的智能处理器(IPU)提供动力,旨在满足人工智能独特的计算要求。公司于2016年成立于英国布里斯托,目前海外办公室和客户遍布欧洲、亚洲和美洲国家及地区。拟未的计算系统广泛应用在各行各业的人工智能应用中,包括制药、金融服务、汽车行业和消费互联网服务。

http://www.graphcore.cn/
相关技术
Samsung Group机构

三星集团是韩国最大的跨国企业集团,同时也是上市企业全球500强,三星集团包括众多的国际下属企业,旗下子公司有:三星电子、三星物产、三星航空、三星人寿保险、雷诺三星汽车等,业务涉及电子、金融、机械、化学等众多领域。 三星集团成立于1938年,由李秉喆创办。三星集团是家族企业,李氏家族世袭,旗下各个三星产业均为家族产业,并由家族中的其他成员管理,集团领导人已传至 李氏第三代,李健熙为现任集团会长,其子李在镕任三星电子副会长。

联想集团机构

联想集团是1984年中国科学院计算技术研究所投资20万元人民币,由11名科技人员创办,是中国的一家在信息产业内多元化发展的大型企业集团,和富有创新性的国际化的科技公司。 从1996年开始,联想电脑销量一直位居中国国内市场首位;2005年,联想集团收购IBM PC(Personal computer,个人电脑)事业部;2013年,联想电脑销售量升居世界第一,成为全球最大的PC生产厂商。2014年10月,联想集团宣布了该公司已经完成对摩托罗拉移动的收购。 作为全球电脑市场的领导企业,联想从事开发、制造并销售可靠的、安全易用的技术产品及优质专业的服务,帮助全球客户和合作伙伴取得成功。联想公司主要生产台式电脑、服务器、笔记本电脑、智能电视、打印机、掌上电脑、主板、手机、一体机电脑等商品。 自2014年4月1日起, 联想集团成立了四个新的、相对独立的业务集团,分别是PC业务集团、移动业务集团、企业级业务集团、云服务业务集团。2016年8月,全国工商联发布“2016中国民营企业500强”榜单,联想名列第四。 2018年12月,世界品牌实验室编制的《2018世界品牌500强》揭晓,排名第102。

Wave Computing机构

Wave Computing 是一家位于美国硅谷、致力于推动人工智能深度学习从边缘计算到数据中心的计算加速方案的公司。 Wave Computing, Inc正在用它基于数据流驱动架构(Dataflow Architecture)、系统和解决方案对AI深度学习现有的计算架构产生革命性的影响。与传统架构相比,它为AI计算提供了数量级的性能改进。公司的愿景是“为客户提供强大的深度学习计算能力、提升深度学习的速度和效率,无论客户数据是来源于数据中心还是边缘”。Wave将旗下的数据流驱动架构(Dataflow Architecture)和MIPS嵌入式RISC多线程CPU核及IP进行整合,致力于为下一代AI技术的发展提供源动力。Wave Computing被授予Frost&Sullivan 2018年“机器学习行业技术创新领袖”(Machine Learning Industry Technology Innovation Leader),并被CIO应用杂志评选为“Top 25人工智能提供商”(Top 25 Artificial Intelligence Providers)之一。加上MIPS,Wave目前拥有全球数百客户以及超过425项授权和待决专利。

https://wavecomp.ai/
现场可编程门阵列技术

FPGA(Field Programmable Gate Array)是在PAL、GAL等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。

推荐文章
暂无评论
暂无评论~