英伟达于今天发布了新一代嵌入式计算平台 Jetson TX2。至此,作为人工智能终端计算解决方案的 Jetson 系列也进入了 Pascal 架构时代。
本次发布的 Jetson TX2 延续了该系列小体积、高度集成的特性,在名片大小的尺寸上整合了 4 核 ARM A57 CPU、Pascal 架构 GPU(16 纳米工艺)、最高 8G 内存、32G 固态存储器等组件。该设备的标准功耗为 7.5W,小于 Maxwell 架构的前一代产品。另外,英伟达宣称在有必要时 Jetson TX2 也可以将功率提高到 15W,从而达到 TX1 两倍的计算能力。
NVIDIA 全球副总裁、Tegra 事业部总经理 Deepu Talla 表示:「Jetson TX2 为终端设备实现了强大的 AI 功能,让新型智能机器成为可能。这些设备将支持智能视频分析,使我们的城市更智能、更安全,它们还将助力打造能够优化制造流程的新型机器人,并将促成全新的合作模式,使远程作业更具效率。」
与 Jetson TX2 共同推出的还有英伟达为该平台设计的新版开发工具包 Jetpack 3.0。英伟达表示新工具的性能相对上一代(Jetpack2.3,去年 9 月推出)提高了一倍。该工具包支持 TensorRT 1.0、cuDNN 5.1 等深度学习库。
英伟达致力于通过 Jetson 为人工智能终端设备提供较完整的计算解决方案,并允许开发者在原始芯片的基础上进行扩展/设计。该设备对深度神经网络等机器学习任务进行了优化,并具有低功耗的特点,被认为适用于智能摄像头、无人机和机器人等领域。自 2015 年 11 月推出以来,Jetson 已受到很多厂商和科研机构的青睐,机器人巨头 Fanuc、丰田汽车研究所、麻省理工学院(MIT)等公司和机构都是 Jetson 的客户。该平台最近一次大规模商业应用的案例是在今年 1 月 24 日,美国思科(Cisco)发布的 Spark Board 电话会议系统采用了 Jetson TX1 的解决方案,实现了 4K 在线视频会议。
「预计到 2020 年,全世界将有 10 亿个智能摄像头,」英伟达软件专家李明博士表示。「这意味着巨大的计算量需求,将数据通过网络传送到云端处理会面临延迟、带宽和隐私等问题。所以,应用智能芯片在终端设备上处理机器学习任务非常重要,是人工智能实用化的关键。」
作为业界领先的芯片制造商,英伟达在机器学习硬件领域目前占据优势,目前大部分用于处理人工智能数据的服务器都使用了该公司提供的 GPU。但该公司仍然面临着英特尔、AMD 等其他厂商的竞争,FPGA 等新架构芯片也在挑战着英伟达的地位。在人工智能嵌入式设备领域还没有一家厂商形成垄断的情况下,英伟达正在试图依靠已有优势建立一个完整的端到端解决方案,实现对数据终端采集处理(Jetson),模型训练(DGX),特征分析平台(Tesla)芯片的全面覆盖。「Jetson 在这一闭环中的作用在于通过机器学习减少无用的数据量,」李明介绍道。「就像在自动驾驶汽车中,一辆车拥有大量摄像头和传感器,每天产生的数据量是以 TB 计算的,这会为数据传输带来很大负担。我们必须采用实时处理的方式。」
相对 FPGA 等单一功能芯片具有更易开发的特点,可以有效降低技术准入门槛。它可以将智能终端的产品设计周期缩短至 1 到 2 周时间,同时因为使用相同的 400pin 接口,使用 Jetson TX1 的智能硬件可以在新产品推出后无需改动,直接升级。
目前,Jetson TX2 已在欧美地区的官网接受预定,预计会在 3 月 14 日到货,单个开发套件(包含 Jetson TX2 硬件和开发工具包)售价 599 美元(教育版 299 美元),硬件售价 399 美元(2017 年 2 季度开售)。英伟达表示,该设备将于 4 月份在亚洲地区发售。此外,旧版 Jetson TX1 将会降价继续销售。
据 IDC 此前推算,到 2019 年,全世界 40% 的终端设备将会实现智能化,面对万物互联的市场需求,各家芯片公司的竞争在未来势必会愈演愈烈。