英伟达(Nvidia)首席执行官黄仁勋在“山与谷”论坛上表示,中国在开发人工智能硬件与软件方面并未明显落后于美国。虽然中国企业在AI服务和软件领域取得了显著进展,但黄仁勋的评论主要针对中国AI硬件。无独有偶,《金融时报》报道华为已开始交付其最新AI系统,该系统被认为足以媲美英伟达GB200 NVL72,不过其中存在关键差异。
据彭博社播客报道,黄仁勋在论坛间隙表示:“中国没有落后于任何人,他们紧追我们身后,差距非常非常小。”这场汇聚商界领袖与立法者的论坛主要讨论科技与国家安全议题。
在硬件领域,中国众多企业开发的AI芯片已具备与英伟达抗衡的实力。华为凭借从昇腾(Ascend)900系列AI加速器到云数据中心机架级解决方案的全方位布局处于领先地位。该公司最新发布的CloudMatrix 384系统集成384颗双芯片组设计的海思昇腾910C,通过全光网状网络互联。目前华为已向中国客户交付超过10套该系统,显示出市场对英伟达受限硬件的替代需求。
“毫无疑问,华为是全球最具实力的科技企业之一,”黄仁勋评价道,“他们在计算、网络技术和软件能力——这些推动AI发展的核心领域都取得了惊人成就,过去几年进步显著。”
华为CloudMatrix 384系统由16个机架构成:12个计算机架各搭载32颗昇腾910C加速器,另有4个专用机架通过6,912个800G LPO光模块管理光连接。该系统可提供约300 PFLOPs的密集BF16算力,近乎英伟达GB200 NVL72的两倍,内存带宽达2.1倍,HBM2E显存容量超3.6倍。其光互连技术带来显著带宽优势,纵向扩展能力提升2.1倍,横向扩展能力达5.3倍。但在能效方面稍逊,每FLOP功耗高出2.3倍,每TB/s内存带宽能耗多1.8倍,每TB HBM显存功耗多1.1倍。
交付10套CM384系统本身规模有限——尤其考虑到阿里巴巴、字节跳动和腾讯等中国企业第一季度就因预期5月中旬生效的“AI扩散规则”出口限制,豪掷160亿美元采购英伟达H20 HGX GPU。但这可能仅是开端。据传华为现有约百万颗海思昇腾910C库存,可组装2,600套CM384系统。若全部部署,将提供约780 ExaFLOPS密集BF16算力,相当于4,300台英伟达GB200 NVL72设备(约31.2万颗B200 AI GPU)的性能。分析师郭明錤预估2025年仅GB200 NVL72机架出货量就将达2.5-3.5万个,此外英伟达还将供应GB300 NVL72机架及B100/B200/B300 AI GPU。
这意味着英伟达今年提供的AI算力仍将远超华为数个量级。但华为已掌握可与美国巨头比肩的核心技术。