Nvidia在2025年CES的主题演讲中,以回顾公司的发展历程为开场,从最初的NV1和街机游戏机,逐步发展成为AI领域的巨头。Nvidia的目标是将机器学习应用于尽可能多的应用场景,这一切都由Nvidia的GPU驱动——由GeForce建立的王朝。而我们最关注的,无疑是下一代GeForce硬件的发布,这些硬件将由Blackwell架构驱动。
首先,Nvidia发布了RTX 5070 GPU,售价为549美元。Nvidia表示,这款GPU将通过多种方式利用AI技术,以三分之一的价格提供与RTX 4090相当的性能。此外,RTX 5070的移动版将实现更高的性能,其功耗仅为RTX 4090的一半,同时在性能上与之匹敌(尽管这是否指的是移动版4090并不完全清楚)。
接下来是RTX 5090,作为这一代的旗舰产品,售价为1,999美元,拥有3,400 AI TOPS的性能。RTX 5080的AI性能略低,为1,800 TOPS,但价格更具吸引力,为999美元,继承了即将下架的RTX 4080 Super的价格。RTX 5070 Ti售价为749美元,拥有1,400 TOPS,而RTX 4070则以549美元的价格提供1,000 TOPS。
从宣布的AI TOPS性能来看,Nvidia在INT8工作负载方面将AI计算能力翻了一番。我们推测,其他核心的性能也有所提升。Nvidia还展示了“RTX Blackwell”,其通过着色器提供125 TFLOPS的FP32图形计算能力,比其Ada产品高出1.5倍,而AI性能则提高了3倍。不过,这是针对完整的GB202芯片,而非用于RTX 5090的缩减版芯片。未来可能会有更高规格的产品,例如RTX 5090 Ti或Titan,或者至少有可能推出一个使用完全启用的GB202芯片的更高层级AI/数据中心部件。
目前,所有宣布的RTX 50系列GPU都使用标准的16Gb(2GB)GDDR7模块。这意味着,尽管RTX 5090的512位接口提供了高达32GB的VRAM,但5080和5070 Ti的256位接口仍然只有16GB的GPU,而5070的192位接口则提供12GB的VRAM。这在目前对大多数游戏来说已经足够,但考虑到AI工作负载对VRAM的强烈需求,未来可能会看到每个GPU的变体与24Gb(3GB)内存模块配对,从而在所有层面上将VRAM容量提高50%。
Nvidia在其所有游戏GPU上拥有双倍的AI计算能力,那么它将如何利用这一能力呢?自然,它计划推出新的功能和软件解决方案来利用这些能力。RTX 5070提供1,000 TOPS的计算能力,几乎与RTX 4090(1,320 TOPS)相同,但价格仅为三分之一,这为更计算密集型的任务打开了大门。
最有可能的用例之一将是基于AI的纹理压缩。我们过去听说过这个概念,并且在上一代硬件上进行了演示,但速度并不理想。然而,随着AI计算能力的提升和更多的训练,我们可以设想这种技术能够以与传统BTC(块截断编码)相同的速度运行。
Nvidia还宣布了移动产品线的名称。将有匹配的RTX 5090、5080、5070 Ti和5070笔记本电脑,预计将于2025年3月上市。虽然型号名称与桌面系列相匹配,但性能将显著降低,我们预计其他规格也将看到类似的削减。RTX 5090笔记本GPU将提供1,850 AI TOPS,起价为2,899美元,基本上等同于桌面RTX 5080。移动版5080降至1,350 AI TOPS,略低于桌面5070 Ti。移动版5070 Ti将拥有与桌面5070相同的1,000 TOPS,而普通的5070笔记本GPU将提供高达800 AI TOPS。
主题演讲的其余部分,Nvidia花了很多时间谈论AI在各种其他领域的应用,如车辆、医疗、仓库和机器人等。这些都是我们过去几年中从Nvidia反复听到的内容,而且都很有趣。
此外,Nvidia还展示了其新的“AI超级计算机”,名为Project Digits,它将一个Grace Blackwell GB10超级芯片集成到一台迷你PC中。该设备运行完整的DGX软件堆栈,配备20个Grace CPU核心、1 PFLOPS的FP4性能、128GB内存和4TB SSD,比现有的DGX服务器更经济实惠且便携,也更适合放在桌面上使用。
总的来说,这次主题演讲中最令人兴奋的部分无疑是RTX 50系列的发布,但目前我们仍有很多未知之处。这些信息将在接下来的几天内逐步揭晓,我们期待RTX 50系列的全面发布将在本月月底前开始。