据摩根大通(通过@Jukanlosreve)披露,英伟达计划于明年推出的Vera Rubin人工智能与高性能计算平台,可能为AI硬件供应链带来重大变革。该公司拟向合作伙伴直接供应完全组装好的Level-10(L10)VR200计算托盘,所有计算硬件、冷却系统及接口均预装完毕。这一举措将使大型原始设计制造商无需承担设计或集成工作,虽简化其业务流程,却会压缩其利润空间以提升英伟达的盈利水平。目前该消息尚未获得官方确认。

据报道,从VR200平台开始,英伟达正筹备接管全集成L10计算托盘的生产工作,这些托盘将预装Vera中央处理器、Rubin图形处理器及冷却系统,取代以往由超大规模厂商和原始设计制造商合作伙伴自行设计主板与冷却方案的模式。这并非该公司首次向合作伙伴提供部分集成的服务器子系统:此前在GB200平台就曾交付预装关键组件的完整Bianca主板。不过当时这仅属于L7-L8级别的集成,而如今据称该公司正考虑直接推进至L10级别,将包含加速器、中央处理器、内存、网卡、供电硬件、中板接口及液冷冷板在内的整个托盘组件作为预装测试模块进行销售。
若消息属实,英伟达确实向合作伙伴交付L10计算托盘(其成本约占服务器总成本的90%),则合作伙伴将仅需负责机架级集成而非服务器设计。他们仍需要构建外部机箱、根据需求集成电源系统、安装机架级冷却的边车或冷却分配单元、搭载自有基板管理控制器与管理堆栈,并执行最终组装测试。这些操作环节虽具运营价值,但无法形成显著的硬件差异化优势。
这一战略有望加速VR200平台的量产进程——合作伙伴无需自主完成全链条设计,且通过英伟达与电子制造服务商(推测以富士康为主力供应商,广达与纬创为辅)的直接合约实现规模效应以降低生产成本。例如黄仁勋近期展示的Vera Rubin Superchip主板采用极复杂设计、超厚印刷电路板及全固态组件,此类板卡设计既耗时又成本高昂,故选择特定电子制造服务商进行生产具有显著合理性。
摩根大通报告指出,Rubin图形处理器功耗从Blackwell Ultra的1.4千瓦升至R200的1.8千瓦,某未发布型号的热设计功耗甚至达到2.3千瓦(英伟达拒绝对汤姆硬件网的相关问询置评),随之增强的冷却需求成为推动整体托盘供应模式替代独立组件供应的重要因素。但根据供应链消息,包括微软在内的多家原始设备制造商、原始设计制造商及超大规模厂商正在测试浸没式冷却、嵌入式冷却等尖端冷却系统,彰显其技术积淀。
此举意味着英伟达的合作伙伴将从系统设计师转型为系统集成商、部署服务商与技术支持方。他们仍将保留企业级功能定制、服务合约、固件生态系统维护及部署物流等业务,但服务器的“心脏”——计算引擎——将由英伟达标准化固定供应,不再由原始设备制造商或原始设计制造商自主开发。
此外,业界关注基于Rubin Ultra平台的英伟达Kyber NVL576机架级解决方案的后续发展。该方案计划随支持兆瓦级机柜的800伏数据中心架构同步面世。当前核心悬念在于:英伟达会否进一步扩大其在供应链中的份额,例如直接涉足机架级集成领域?



