2016年是人工智能爆发的一年,随着深度学习理论的快速发展,各种深度学习的应用层出不穷,从人脸识别,图片风格转换到自动驾驶,不一而足。在这些人工智能应用的背后,则是以GPU为代表的人工智能硬件。借着人工智能的风头,Nvidia的股价在去年飞升三倍有余,令人惊叹。几天前,2017年CES更是请Nvidia的黄仁勋作为开幕前夜最重头的专场演讲的嘉宾。毫无疑问Nvidia已经成为了本届CES的焦点。下面我们将为大家分享这场专场演讲的内容并分析Nvidia展露的未来计划。
关键词:Imagination
本次Nvidia老黄给我们带来的CES演讲中,关键词是“Imagination”(想象)。通过Imagination这个关键词,Nvidia很好地涵盖了自己从游戏渲染加速到人工智能的业务群。
在开场动画中,老黄首先播放了一系列3D游戏的画面(包括泰坦陨落2,猎魔人等3A大作),也回顾了Gravity等特效电影。之后画风一转,激发人类想象力的从传统的3D游戏和电影特效转到了让人身临其境的AR和VR设备。在这之后,则开始展示给人巨大想象力空间的人工智能应用,包括机器人,自动驾驶,以及人工智能辅助医疗等等。而在这一切激发人们想象力的应用背后,都站着一个硬件巨头,Nvidia。这段动画也很好地回顾了Nvidia业务的历史轨迹:始于GPU图像渲染加速,从一个半导体芯片公司慢慢走向未来AR/VR以及人工智能平台的提供者。
GeForce Now与Shield:游戏云平台与家庭物联网新中心
在回顾了过去在计算机图像、游戏和人工智能领域的一系列成就后,老黄开始发布第一项内容:GeForce Now。
Nvidia的辉煌始于游戏领域在快速发展。在二十年前,PC和主机游戏还是以低分辨率的2D为主,3D游戏要么是假3D (如《暗杀希特勒》),而真3D游戏的图像非常粗糙,多边形数量很少,劳拉小姐的脸就是一个锥子。Nvidia正是在当年看好电子游戏会成为人们未来的主流娱乐方式并开始开发显示加速卡,从而一举推出GPU的概念并且在游戏市场上赚得盆满钵满。在GPU获得成功后,Nvidia进一步推出了自己的游戏主机Shield。而到如今,Nvidia已经不满足于游戏硬件提供商的角色,而是在试图定义一种崭新的游戏平台并且成为该游戏平台的主人。GeForce Now就是这样的一种平台。
GeForce Now的逻辑是:目前尚有数量巨大的电脑用户因为自己的电脑硬件不够强因此玩不到游戏。为了让这部分人也玩上3A大作,GeForce Now把游戏运行在处理能力极其强大的云服务器上,而把游戏的图像和声音通过网络传到玩家的电脑上。因此只要玩家的电脑能上网,无论其硬件多弱都可以玩到最新的游戏。通过GeForce Now,Nvidia的野心是利用其在游戏市场的影响力,从硬件供应商转型为游戏云服务提供商,这样就一下从第二产业(制造业)转身进入了第三产业(服务业),岂不美哉?
那么人们不禁要问:如果GeForce Now特别成功,那么大多数为了玩游戏而买的高性能PC就没用了,甚至连游戏主机都有下岗的危险,如此一来Nvidia自己的Shield主机又该怎么办?别急,Nvidia早就为自家主机想好了出路,就是家庭物联网的新中心。
老黄在CES发布的第二项内容是新Shield。新Shield除了拥有常规的游戏和互联网视频播放功能外,最大的亮点是引入了Google助手。Google助手可以通过语音识别完成用户下的各种指令,如在CES演讲的演示视频中,就出现了用户通过与Google助手语音交谈从而让Shield播放视频,展示照片等。然而,Nvidia对Shield的野心远不止“支持语音交互的智能机顶盒”,而是智能家庭中心。为了让Shield能接收用户从家里任何地方发出的语音指令,老黄在发布新Shield的同时还展示了与新Shield搭配使用的NvidiaSpot。NvidiaSpot是经过特别设计的麦克风,可以放置在家里的任何地方,并且通过局域网与Shield连接起来,把用户的语音指令传输到Shield。同时,在Nvidia的计划中,Shield可以控制的也远远不止电视机,而是可以控制各种智能家电(如Nest的产品)。这样,在Nvidia提供的智能家庭方案中,Nvidia Spot作为用户指令的接收者遍布家的每一个角落,用户在任何地方下的语音指令通过Spot传回物联网中心节点Shield,而Shield则根据指令来控制家庭的智能家电,如打开空调,启动扫地机等等。
GeForceNow以及新Shield都显示了Nvidia试图将旧有的游戏硬件业务升级转型的尝试。我对于GeForceNow的评价是,要是没法解决网络延迟的问题根本就没戏。目前最流行的游戏是动作游戏(枪),模拟驾驶游戏(车)以及各种体育游戏(球),而枪车球对于输入延迟的要求非常高,一旦玩家的输入(如在驾驶游戏里转动方向盘)距离游戏响应(游戏里的车真正改变方向)有上百毫秒的延迟,玩家的体验就会变得很糟糕。问题是,目前决定网络延迟的不仅仅是玩家的接入网络带宽,而是从玩家接入点到GeForce服务器中心间的任何地方网络变慢都会成为短板增大延迟从而极大地影响玩家体验。另外,是否有那么多人是因为缺乏硬件而不玩游戏也是个问题——很可能大部分人就是对游戏没兴趣,即使给他们足够运行游戏的硬件也宁愿去做其他事情而不是玩游戏。所以,GeForceNow看上去很美,实际上却还有许多路要走。
对于Shield+Spot的家庭物联网中心战略,在Nvidia之前其实也有不少类似的试图将游戏机升格为家庭客厅娱乐中心的尝试,然而都失败了。典型的就是Sony的PSX,当年Sony借着在游戏主机(PS2),视频播放机(DVD)和电视机领域的龙头地位,试图将PSX打造成能玩PS2游戏,能播放/录制DVD又能播放/录制录像的客厅娱乐中心,然而惨遭失败。类似微软也试图将XBOXOne打造成既能看互联网视频又能玩游戏的客厅娱乐中心,然而并没有取得成功,反而在与PS4的鏖战中渐渐处于下风。直到PhilSpencer上台执掌Xbox后,才重新将XboxOne定义为游戏机,并解散了专门为Xbox制作电视内容的娱乐部门,将重心移回游戏后才逐渐找到方向。所以Nvidia和Google合作的Shield+Spot家庭物联网中心战略能否成功还需要时间去验证,尤其在连物联网智能家电尚未普及的今天,Nvidia就已经发布了家庭物联网中心,只能说是在为未来布局而不可能在短期内就带动Shield的销量。未来如果Shield真能成为新的家庭物联网中心,GooDia(Google + Nvidia)将成为WinTel(微软Windows + Intel)之后又一对软硬件巨头联盟。
Xavier:1TOPS/W成为深度学习硬件平台新标杆
如果说GeForce Now和Shield+Spot只是老黄此次CES主题演讲的开胃前菜,那么在这之后发布的Xavier就是重头戏了。
Xavier是Nvidia预期在2017年正式发售的车载超级计算机模组。Xavier包含了拥有512 CUDA核的Volta GPU,8核心的Nvidia定制ARM64 CPU。最令业界震惊的,可谓是其性能:在峰值性能达到30TOPS的情况下,仅仅消耗30W!也就是说,其能量效率达到了1TOPS/W。相形之下,2017年发布在半导体领域最顶级会议ISSCC Deep Learning Processor Session的第一篇paper,ST最顶尖的深度学习专用ASIC也仅仅实现了2.9TOPS/W。
需要记住的是,ST的深度学习加速器是专为深度学习开发,一般而言只能做深度学习计算;而Xavier是一款通用的计算平台,1TOPS/W的性能除了可以计算深度学习外还可以做其他计算,因此通用性远好于ASIC。通常专用的ASIC的能量效率应当比通用计算平台好一个数量级左右,而现在这个差距被缩小到了3倍不到,可见Xavier性能之强大。在性能相差不大的情况下,大多数人都会选择通用计算平台而非ASIC,因此相信从事深度学习加速器ASIC研发的工程师们看到Xavier这个指标真的是压力很大。
另一个有趣的细节是,Xavier的性能并没有用常规GPU的FLOPS(每秒浮点运算量)做单位,而是OPS(每秒定点数运算量)。在往常的GPU中,深度学习计算通常用浮点数运算来完成,这样的做法在保证计算精度的同时却损失了计算速度,因此深度学习硬件的一个很热门的方向就是如何用定点数运算来代替浮点数运算,在保证计算精度损失可控的情况下大幅提升速度。Nvidia在PascalGPU上已经做了一些对于定点数计算的支持,而根据CES的主题演讲透露出的蛛丝马迹,下一代VoltaGPU上想必会加强对定点数运算的支持。而Nvidia作为深度学习硬件领域的绝对统治者,其对于定点数运算的大力支持又会倒逼深度学习算法开发者加强对于使用定点数的深度学习框架的开发。在可预计的将来,使用定点数的深度学习网络将会变得越来越流行。
在不同平台上上使用浮点数与定点数计算效率的对比
ADAS系统成为Nvidia人工智能战略重点
人工智能是Nvidia未来发展的重中之重。人工智能未来市场有多大已经不必多说,而在这次CES主题演讲中老黄选择了ADAS(高级驾驶员辅助系统)作为Nvidia人工智能平台的切入点。
在自动驾驶方面,Nvidia发布了搭载Xavier的BB2无人驾驶车,BB2目前能实现根据路况自动变道,减速转弯,避让行人等等。Nvidia与奥迪合作,预期在2020年实现第四级无人驾驶(即仅仅在极少情况下需要人工干预的自动驾驶系统)。
Nvidia无人驾驶系统演示
除了无人驾驶之外,Nvidia还发布了协同驾驶(co-pilot)系统,该系统在无人驾驶技术尚未成熟前可以辅助驾驶员从而让开车变得更轻松又安全。
协同驾驶技术共包含四大要点,包括面部识别,头部追踪,视线追踪以及读唇技术。面部识别首先可以通过深度学习判断驾驶员的表情从而进一步判断驾驶员的情绪状况,在发现情绪不稳时提醒驾驶员即使休息调整情绪以避免发生冲动驾驶。头部追踪和视线追踪可以帮助协同驾驶系统判断驾驶员注意力是否集中,并在驾驶员分神时及时提醒。读唇技术则可以在环境较吵闹的情况下根据驾驶员嘴唇的动作判断其发出的语音指令并予以执行。根据老黄的解释,Nvidia正在和英国牛津大学LipNet团队合作研发用于读唇的深度学习网络模型,目前该模型已经能达到93.4%的正确率,可望很快就能用在真正的汽车中。最后,协同驾驶系统还能为驾驶行为打分,在督促驾驶员安全驾驶的同时也能够成为保险公司制定保费的依据。
在人工智能领域,Nvidia的人工智能平台已经占有统治地位。除了硬件之外,Nvidia目前的CUDA是人工智能硬件加速的主流编程语言,而结合CUDA的CuDNN也因为其高性能成为极受欢迎的深度学习框架。那么,人工智能有这么多方向,为什么Nvidia会选择ADAS作为战略重点呢?首先,从市场上说,汽车运输市场确实是一个巨大的市场。黄仁勋提到,目前的运输市场规模可达一万亿美元,全球共有十亿量跑在路上的汽车,而汽车运输市场又是一个损耗严重的市场,主因就是人类驾驶员容易犯错。一旦驾驶员犯错,车祸带来的损失非常大。如果用人工智能帮助驾驶,那么这些损耗可以被大大降低。
除此之外,另一个重要的事实是,Nvidia的人工智能平台(尤其是硬件)最适合的应用场景就是ADAS。Nvidia的人工智能平台最具优势的应用场合就是数据量中等、计算能力要求高、对功耗有一定要求但是并不苛刻的地方。在数据量巨大的数据中心,Nvidia的GPU是服务器不可或缺的一部分,但是Nvidia自己目前还没有打算自己做服务器,因此在大数据人工智能市场Nvidia提供的是硬件而非平台。在另一个极端,即数据量不大,对运算能力要求不高但是对功耗有极大限制的嵌入式深度学习领域,Nvidia基于GPU的人工智能平台一方面功耗太大,另一方面过高的计算能力反而导致成本过高,因此无法与ASIC抗衡。而在ADAS市场,Nvidia的人工智能平台无论计算能力(10-100TOPS)还是功耗(10-100W)都能完美地符合要求,因此Nvidia主打自动驾驶市场并不奇怪。
结语
Nvidia在CES的主题演讲中显示了它从芯片公司全面转型成为云服务、物联网以及人工智能平台提供商的野心。在2016年成功抓住人工智能风口市值翻了3倍之后,让我们拭目以待Nvidia在2017年的表现。