美国券商研究在涉及中国人工智能GPU领域的一些共识点上趋于一致,尤其在该行业竞争日趋激烈、本土企业激增而西方巨头如英伟达(NVIDIA)面临限制的背景下。

Cover Image

具体而言,美国券商研究目前聚焦于中国人工智能GPU供应链的四个关键要素:

中芯国际(SMIC)的7纳米制程良率与产能仍是主要忧虑点。需注意,华为昇腾910C GPU绝大部分采用台积电(TSMC)7纳米晶圆,据称华为通过第三方渠道大批量采购了这些芯片。

中国云服务提供商(CSP)为获取紧俏的人工智能GPU采取了多样化策略。为遏制中国企业通过云端获取西方尖端人工智能GPU,美国众议院正在审议《远程访问安全法案》。

英伟达即将推出的专为中国市场设计的B40人工智能GPU,是这个亚洲巨头不断演进的人工智能格局中的另一关键方面。虽然特朗普政府已允许英伟达恢复向中国出货旧款H20 GPU(削减15%性能),该芯片正日益遭遇中国政策圈的抵制。

人工智能资本支出计划构成了这一复杂格局的最后一环。中国当前力推人工智能算力100%自给自足,这要求主要参与者投入巨额资金。

需注意,深度求索(DeepSeek)的DeepGEMM人工智能模型(仅于2025年2月发布)基于英伟达CUDA框架开发,并采用英伟达GPU进行训练。但许多中国本土人工智能GPU厂商也能通过UEBMO FP8内存计算格式支持该模型。

华为的CloudMatrix 384系统可捆绑多达384颗昇腾芯片,但缺乏对FP8等内存优化计算格式的直接支持。采用FP8格式训练人工智能模型通常能大幅降低内存消耗。当然,华为已开发转译工具以实现对FP8的人工兼容,但该解决方案仍非最优。

阿里巴巴正在自主研发人工智能GPU。而被誉为“中国英伟达”的寒武纪(Cambricon)凭借思元590 GPU销量暴增,正经历股价狂潮。

然而,多数券商研究发现市场仍显著偏爱英伟达GPU。这主要源于英伟达GPU提供更卓越的软件支持(尤其通过CUDA生态系统),且借助NVLink互联技术在集群中表现更优。

最后需注意,基于B40芯片的英伟达RTX Pro 6000D系统在中国销售无需单独许可,因为这些系统未采用高带宽内存(HBM),主要应用于推理而非基础人工智能模型训练。因此,这些芯片一旦向中国企业开放,极可能引发抢购热潮。


文章标签: #人工智能 #英伟达 #GPU #中国市场 #半导体

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。