谷歌发布Chrome 140更新,修复多个安全漏洞
阅读全文

锤刻创思寰宇网
据DigiTimes报道,尽管戴尔(Dell)等英伟达(Nvidia)合作伙伴已启动基于GB300服务器的早期生产,但大规模出货预计要到2025年9月才会开始。得益于战略性的设计复用和供应链协同优化,本次产品迭代预计将比前几代更顺利,但液冷系统仍是原始设计制造商(ODM)面临的主要挑战。
消息人士透露,英伟达决定沿用当前GB200平台的主板设计是加速过渡的关键因素。此外,英伟达给予合作伙伴更大的设计自由度——据SemiAnalysis分析,GB300采用模块化方案:B300GPU以SXM Puck模块形式提供,GraceCPU采用独立BGA封装,硬件管理控制器(HMC)由Axiado供应,其余主板组件由客户自行采购。CPU内存采用标准化SOCAMM内存模块,网络交换托盘与铜背板仍由英伟达统一提供。这种设计复用避免了全盘重新设计,有效降低了生产风险。
相比之下,GB200采用高度集成的Bianca主板,将B200GPU、GraceCPU、512GB LPDDR5X内存及供电模块全部集成于单块PCB板。
目前GB300已进入验证与试产阶段,ODM厂商反馈未遇重大障碍。供应链信息显示,元件认证按计划推进,英伟达有望在2025年第三季度实现产能爬坡,第四季度出货量将显著提升。主要计算板供应商纬创(Wistron)表示,本季度营收将因GB200与GB300代际交替而持平。与当前平台过渡期遭遇的芯片良率、服务器布局密度及散热等连环问题相比,本次迭代明显更为顺畅。
尽管GB200已大规模部署于数据中心,但DigiTimes指出其液冷系统存在持续性缺陷——快拆接头在工厂压力测试后仍出现渗漏。运营商被迫采取局部停机与全面检漏等应对措施,实质上是以牺牲硬件可靠性为代价换取部署速度。
英伟达下一代AI服务器平台代号为Vera Rubin,将分两阶段推出:第一阶段沿用现有Oberon机架(型号保持NVL144),用VeraCPU替换GraceCPU,BlackwellGPU升级为RubinGPU;第二阶段将启用全新Kyber机架,搭载VeraCPU与四计算芯粒设计的Rubin UltraGPU。由于RubinGPU功耗更高,液冷系统的可靠性挑战将进一步加剧——GB200的实践表明,管道配置与水压的部署差异导致渗漏问题难以根治,后续维护成本居高不下。