作者 / 华卫
一夜之间,曾是业界算力最高的智能汽车芯片Atlan被「淘汰」了,原本规划好的量产时间线也被直接占用。
9月20日,英伟达在2022秋季GTC大会上推出了新一代自动驾驶计算芯片Drive Thor。该公司声称,Thor单颗芯片算力在2000TOPS,吞吐量是Atlan的两倍,交付性能也是Atlan的两倍以上。
「今天,高级驾驶辅助、泊车、驾驶员监控、摄像镜、数字仪表盘和信息娱乐等系统都分布在汽车中的不同计算机中。在2025年,这些功能将不再是独立的计算机,Thor将把这些功能整合到一个系统架构中,从而降低了总体的系统成本。」英伟达汽车副总裁丹尼·夏皮罗(Danny Shapiro)进一步补充道。
也就是说,除超高的算力外,Thor还具有高度的集成性,几乎满足了所有汽车智能化功能的计算需求。据悉,Thor将于2025年上车量产,而吉利旗下的极氪将是全球第一个为旗下车型配备Thor的品牌。
一颗芯片「统治」汽车?
英伟达创始人兼首席执行官黄仁勋 (Jensen Huang) 表示,「加速运算与 AI 的发展正以光速进步,而Thor 是集中式计算机的超级英雄,其具有快如闪电的运算效能,能在车辆上提供可持续升级、安全有保障的、由软件定义的超级计算机。」
据介绍,Thor达到这样的性能,得益于其对CPU(Grace)、GPU(Ada Lovelace)和Hopper(处理 Transformer模型引擎)进行了升级。其中,Hopper提供了令人惊叹的Transformer引擎和Vision Transformer的快速变革,而Ada是英伟达基于4nm工艺打造的最新GPU产品。
支持多域计算
Thor能够被配置为多种模式,可以将其 2000 TOPS 和 2000 TFLOPs 全部用于自动驾驶工作流,也可以将其配置为一部分用于驾驶舱AI和信息娱乐,一部分用于辅助驾驶。
这是因为Thor支持多域计算,可以为自动驾驶和车载信息娱乐等功能划分任务区间,允许其各自独立运行,并同时进行具有高度时效性的运算作业。
Thor的这种多计算域隔离能力,使并发的时间关键型进程得以不间断运行。也就是说,车辆在一台计算机上可以同时运行 Linux、QNX 和 Android。
通常,车辆各处分布着数十个电气控制单元,分别为各个功能提供动力。借助Thor,汽车制造商可以在单个片上系统整合多种功能,从而简化了车辆设计开发,不仅降低成本,还减少电缆、减轻车身重量。
而且,Thor可以让所有的车辆显示器、传感器等都连接到单一芯片上,以简化汽车制造商的复杂供应链。
提升深度神经网络精度
除原始性能之外,Thor在深度神经网络精度方面也有了提升。
Thor是第一个集成Transformer引擎的AV平台,这是NVIDIA GPU Tensor Core的一个新组件,能将视频数据处理为单个感知帧,使计算平台能够随着时间的推移处理更多数据。
借助该引擎,Thor可以将深度神经网络的推理性提高多达9倍,这对支持自动驾驶相关的大量复杂AI工作负载至关重要。
Thor 的另一个优势是 8 位浮点 (FP8) 精度。通常情况下,当数据类型从32位浮点数转换为8位整数时,深度神经网络的准确性会下降。Thor 具有 2000 TOPS的 FP8 精度,使得这种过渡得以简化,开发人员可以在不牺牲精度的情况下转换数据类型。
此外,Thor使用了升级后的ARM Poseidon AE内核,成为业内性能最高的处理器之一。
「二芯合一」互连技术
Thor还采用了英伟达最新推出的NVLink-C2C芯片互连技术,该技术可以使两个连接起来的Thor芯片成为运行单个操作系统的单片平台。
其主要优势在于它能够以最小的算力开销完成跨链路共享、调度和分配工作,这为汽车制造商提供了更多计算空间和灵活性来构建软件定义的车辆,这些车辆可以通过安全的无线软件更新持续升级。
「为最高级功能安全设计」
谈及自动驾驶的安全性方面,英伟达声称,其在安全系统和流程上的研发投入已超过1.5万人工年,并对500万行代码进行了安全评估,而Thor是他们「专为最高级别的功能安全所设计的」。
据了解,Thor SoC和AGX 板的开发均符合ISO 26262 标准,其软件堆栈的设计也符合 ISO 26262 和 ASPICE 标准。此外,Thor SoC和软件的设计和生产符合 ISO 21434 标准,这为遵守UNECE第155号法规等监管安全提供了途径。
极氪将首发搭载
极氪是第一个为Thor「举手」的人。夏皮罗表示,从2025年开始,极氪将使用该芯片生产下一代汽车。
那么,受到美国芯片禁令限制的英伟达,能如期向中国客户交付Thor吗?
今年9月初,美国政府对俄罗斯和中国(包括中国香港)实施了先进人工智能芯片的出口限制令,其中涉及英伟达用于加快机器学习任务的H100和A100 AI芯片以及AMD的MI250AI芯片。
此前,科技领域分析师Daniel Zlatev就表示,美国禁止英伟达和AMD出口人工智能芯片,可能会间接影响到中国蓬勃发展的电动汽车行业。
对此,夏皮罗表示,汽车客户不会受到英伟达高端数据中心产品限制的影响,该公司正与中国客户和美国政府合作,旨在「提出不同的替代方案,不受相同许可证要求的约束。」
自动驾驶汽车仿真能力再进步
此次,黄仁勋还介绍了他们面向自动驾驶汽车开发与部署的端到端平台NVIDIA Drive。在开发方面,Drive包含Replicator 合成数据生成、Drive Sim和Drive Map;在部署方面,该平台包含全栈驾驶和车内 AI 应用、AI 计算机和 Hyperion 自动驾驶汽车参考架构。
据悉,Drive平台更新了一系列新功能,涉及Drive Sim、Replicator 合成数据生成、AI模型改进、Drive Map 自动驾驶车队地图构建、城市和高速公路驾驶及停车等方面。
大会上,黄仁勋主要讲解的是Drive Sim的两项新功能。
一是AI工作流Neural Reconstruction Engine,它可以根据记录的传感器数据构建3D场景,在3D场景导入Drive Sim后,通过人工创建或AI生成的内容对其进行增强。而且,这个从视频到3D几何图形的工作流可以在NVIDIA OVX系统上运行,能够在全球范围内创建模拟场景。
二是硬件在环,该功能使整个车载软件栈可以在AI工厂运行,还可以模拟车内环境。未来的汽车不仅有简单的仪表板,还有将数字设计与物理设计相结合的环绕显示屏,汽车工程师、软件工程师和电子工程师可以通过Drive Sim展开协作,同时运行所有的实际计算机与软件栈。
英伟达称,「DRIVE Sim将会成为工程师的虚拟设计工作室。」
据了解,DRIVE Sim是英伟达基于Omniverse构建的仿真工具,而Omniverse是英伟达提出的虚拟世界仿真引擎。此次活动中,英伟达还宣布推出Omniverse Cloud,用于构建和运营车辆设计等工业元宇宙应用。
参考:
https://nvidianews.nvidia.com/news/nvidia-unveils-drive-thor-centralized-car-computer-unifying-cluster-infotainment-automated-driving-and-parking-in-a-single-cost-saving-system
https://blogs.nvidia.com/blog/2022/09/20/drive-thor/
https://venturebeat.com/ai/could-nvidias-thor-chip-rule-automotive-ai/
https://benchlife.info/nvidia-drive-thor/