机器之心

首页 > 资讯 > AMD推出首个基于VEGA GPU架构的机器学习芯片,打响智能芯片战争

资讯

AMD推出首个基于VEGA GPU架构的机器学习芯片,打响智能芯片战争

2016-12-13 16:34:31      
0 0 0

AMD 最新发布Radeon Instinct系列芯片以正式进军机器学习,把矛头指向英伟达。

RadeonInstinct.png


总部在加州桑尼维尔的这家半导体公司正跟随其竞争对手的步伐,以显卡作为公司进军机器学习与人工智能的排头兵。AMD 的显卡也是硬件和开源软件的结合体,这款新推出的人工智能芯片是基于 AMD 在今年早些时候推出的北极星图像处理结构而设计的。

「AMD 必须尽快部署自己的显卡产品开发战略,既有的产品已经远远落后于人工智能的发展需求,」Tirias 研究机构的分析师 Kevin Krewell 评论。

radeon-instinct-100698420-orig.jpg

上图:Raja Koduri AMD 镭龙技术组的负责人,图片来自:Dean Takahashi

这款芯片的研发旨在大幅提升计算机在处理深度神经网络相关工作上的表现,能够更高效且更轻松执行相关工作。新的 Radeon Instinct 加速芯片将给从事深度学习训练和推论的研究机构更强劲的 GPU 来开展深度学习相关研究。

「我们把显卡作为公司今后 5 到 10 年的发展战略,」AMD 的 CEO Lisa Su 在接受 VentureBeat 的采访时说道。「我们当时所制定的发展战略的第一步是『普通消费水平的显卡是很重要的,它构建了我们的核心用户基础。』这也是我们年初发布北极星的缘由。但是我们的战略不止于此,我们的计划永远是把目光投向整个显卡生态链,这一点是不容置疑的。下一个阶段我们的重点是确保我们硬件有足够的市场竞争力以及相应软件平台的构建。」

Raja Koduri AMD 镭龙技术组的高级副总在一次采访时说,「我们在显卡领域还大有作为。我们之前的发展战略还没有仔细考虑其中可施展拳脚的地方。以当前显卡市场的市场需求量来看,我们现在拥有的机会更多,巨额的利润依旧存在。仅在显卡研发上,我们还有很大的发展空间。不得不说,芯片的计算能力的确让人兴奋。而且我们终于有了搭载我们自己硬件的软件堆栈,并且我们的软件堆栈也是很诱人的。这对我们来说是件好事。」

除了新的硬件,AMD 也宣布了 MIOpen,这是一个免费的开源 GPU 加速库,用来完成高性能机器智能部署。AMD 也在自己的 ROCm 软件上优化了深度学习框架,来建立下一次机器智能负载变革的基础。

Moor Insights & Strategy 的分析师 Patrick Moorhead 说,「Instinct 系列是 AMD 的良好开端,在开始与英伟达争夺市场前还有很多的工作要完成,也需要更多的检验。让我喜欢的是,他们不只推出了显卡,还发布了平台与软件堆栈。很多消费者想要的是解决方案,而非一堆零件,AMD 如今意识到了这一点。」

廉价的高容量存储、丰富的传感器驱动数据、用户生成内容的指数级增加都在使得全球数据的艾字节(exabytes)增加。近期在机器智能算法上的进展配合高性能 GPU 使得数据处理与理解有了巨大发展,几乎能实时产生洞见。

Radeon Instinct 只是机器智能开放软件生态系统的一个蓝图,帮助加速推断洞见与算法训练。

radeon-instinct.jpg

特别说明一点,此次的Radeon Instinct并不是严格意义上的的显卡,只是加速芯片。这些加速芯片实际上没有任何显示输出的功能,换句话说, Radeon Instinct 是AMD回击英伟达Tesla的利器,纯粹是用来加速计算的加速器。

Radeon Instinct 加速器被设计用来解决一系列机器智能应用。该系列芯片包括基于 Polaris GPU 的 Radeon Instinct MI6 加速器。被动冷却推理加速器能够以 150 瓦完成 5.7 teraflops 的计算,GPU 内存为 16 GB。

Radeon Instinct MI8 加速器配有高性能、节能型的 Fiji Nano GPU,可成为小型化的高性能计算和推断的加速器,巅峰性能可达到 8.2 teraflops 而电耗少于 175 瓦,还有 4 GB 的高带宽内容。

Radeon Instinct MI25 加速器将使用 AMD 的下一代高性能 Vega GPU 架构,被设计用来完成深度学习训练,优化时间。

161213162040.png

免费、开源的 MIOpen GPU 加速库将预期在 2017 年第一季度亮相,为标准流程提供 GPU 精调部署,比如卷积、池化、激活函数、正则化和张量形式。

AMDRocM.pngROCm 深度学习框架为 Caffe、Torch 和 TensorFlow 进行过优化,能让编程员专注于神经网络的训练,而非 ROCm 融合其他框架时出现的低级性能调整。

ROCm 打算成为机器智能问题集下一进化的基础,带有针对特定领域的编译器完成线性代数和张量,以及一个开放的编译器和语言运行时。

Radeon Instinct 产品预期在 2017 年上半年开始出货。

声明:本文由机器之心编译出品,原文来自venturebeat,作者Dean Takahashi,转载请查看要求,机器之心对于违规侵权者保有法律追诉权。

  1. 网站转载请在文章开头粗体注明:本文转载自机器之心,标明作者,并附上本文链接。
  2. 微信公众号转载请在开头粗体注明:本文转载自机器之心,标明作者,并设置阅读原文链接为本文链接,微博转载请附上本文链接并@机器之心synced。
  3. 网站和微信转载具体文章后需来信至邮箱operation@jiqizhixin.com说明,备注转载文章标题、转载的微信号名称和转载日期。
  4. 机器之心只接受如上几种转载方式,其余均视为侵权,如需商业合作请致信bd@jiqizhixin.com。
参与成员:

  • 李亚洲

  • 朱思颖

相关文章

不同硬件不同网络,横向对比五大深度学习框架(附论文第七版)

不同硬件不同网络,横向对比五大深度学习框架(附论文第七版)

从算法、硬件到研究社区,全面回顾2016年机器学习领域主要进展

从算法、硬件到研究社区,全面回顾2016年机器学习领域主要进展

人工智能硬件不能遗忘的4S机遇

人工智能硬件不能遗忘的4S机遇

评论

共有0条评论,点击展开

同步到新浪微博