性能与原版 RTX 4090 类似,但降低了一些 AI 运算能力。
美国对 AI 计算卡的禁令,终于影响到了普通消费者。
本周四,英伟达正式发布了国内特供版高端消费级显卡 ——GeForce RTX 4090D。
GeForce RTX 4090D 是一款符合美国出口规定的 RTX 4090 新品,配备 14592 个 CUDA 核心、24GB GDDR6X 内存、384 位宽内存总线、425W 额定功耗,定价与 RTX 4090 相同,均为 12999 元(约合 1828 美元)。
为了符合美国出口管制的新规定,与 RTX 4090 相比,RTX 4090D 的一些计算能力指标被削减了,主要改动围绕 CUDA 核心。
相比「标准版」显卡,RTX 4090D 的 CUDA 核心数减少了 12.8%,从 16384 个减少到 14592 个(128 个 SM 减少到 114 个 SM),与此同时,功耗也从 450W 减少到 425W,减少了 5.9%。在此之外,两者之间的所有其他核心规格保持不变,包括 384 位宽总线、24GB GDDR6X 内存和 2.52 GHz 升压时钟。
唯一的额外改动是基础时钟速度,新卡已从 2.23 GHz 略微提升至 2.28 GHz。
于今年 10 月 23 日生效的美国出口法规只允许总处理能力(TPP)在 4800 以下的计算卡出口。为此,英伟达开发了 HGX H20 以及 GPU L20 和 L2,它们分别对应人工智能的训练、推理和端侧应用场景。相比 H100 GPU,它们的性能大幅缩水。
与 H100 等专业 AI 加速卡相比,令人疑惑的是,作为消费级显卡,RTX 4090 的性能水平也比规定限制高出 10%(5286),这就是在管制生效后,RTX 再次变得一卡难求的原因。
图源:https://videocardz.com/newz/nvidia-launches-geforce-rtx-4090d-with-14592-cuda-cores-24gb-g6x-memory-and-425w-tdp
英伟达尚未发布 4090D 和 4090 之间的直接性能比较,但毫无疑问,这款新显卡的 TPP 肯定是恰好比 4800 更低一点,该型号也会是面向单一市场的「特供版」。随着美国管制力度的加大,人们对于未来可用算力的担忧还在加剧。
我们不知道在推出 5090 时,英伟达又该如何应对。
参考内容:
https://www.nvidia.cn/geforce/graphics-cards/40-series/rtx-4090-d/
https://www.tomshardware.com/pc-components/gpus/nvidia-launches-china-specific-rtx-4090d-dragon-gpu-sanctions-compliant-model-has-fewer-cores-and-lower-power-draw
https://videocardz.com/newz/nvidia-launches-geforce-rtx-4090d-with-14592-cuda-cores-24gb-g6x-memory-and-425w-tdp