爆款游戏《Balatro》开发者宣布,大型更新1.1版无限期延期
阅读全文

锤刻创思寰宇网
英伟达(Nvidia)的DGX Cloud曾定位于直接面向企业的AI云服务,如今已悄然在该公司的对外战略中退居次席。据内部人士向The Information透露,这家GPU巨头目前将DGX Cloud的大部分算力用于内部研究,而非作为面向客户的产品进行推广。
这一转变虽微妙但确有实据:在2026财年第二季度财报中,英伟达不再将其数十亿美元的云服务支出承诺归因于DGX Cloud——而此前数个季度均保持此项披露。该服务仍列于营收类别,但其角色已明确转向内部基础设施。换言之,DGX仍在持续运作,只是不再与微软Azure或AWS等云服务商正面竞争。
DGX Cloud于2023年推出时定价高昂,每个H100实例月租达36,999美元。在当时芯片短缺的背景下尚属合理,但如今已显失衡。AWS已将H100和A100价格大幅下调45%,不仅低于英伟达直租服务,更使超大规模云租赁成为多数客户的必然选择。随着芯片供应改善,DGX Cloud作为短缺应对方案的价值已实质性蒸发。
英伟达转而将重心投向今年初推出的GPU租赁市场Lepton。与DGX Cloud(英伟达从CoreWeave等新兴云商租用GPU再转租客户)不同,Lepton扮演着流量调度者角色,将计算任务分发至包括AWS和Azure在内的合作供应商——尽管这些巨头自身也提供GPU服务,但仍将加入该市场。这使得英伟达在云端AI经济中更趋近聚合者而非竞争者。
通过将Lepton定位为GPU市场,英伟达得以使中小型供应商持续接入其生态体系。归根结底,该公司无需掌控云基础设施,只需主导技术栈及其衍生的需求通道。即使客户从未接触DGX Cloud,仍在持续向英伟达支付费用。
对开发者而言,从DGX Cloud到Lepton的转变意味着通过现有云平台以更具竞争力的价格获取算力;对英伟达而言,这既减少了渠道冲突,也强化了对全球GPU工作流量的掌控力。