华为正试图在中美科技争夺战中向西方发起有力反击。这家科技巨头开发了一款名为统一缓存管理器(UCM)的新型软件工具,旨在不使用高带宽内存(HBM)的情况下加速大语言模型训练和推理——由于美国出口限制,中国难以获取这种关键存储器。

Cover Image

《南华早报》报道,华为于周二在2025金融AI推理应用落地与发展论坛上发布了该工具。这款创新软件根据各类存储器的延迟特性及不同AI应用的延迟需求,将人工智能数据智能分配至高带宽内存、标准动态随机存取存储器和固态硬盘。

特别值得注意的是,该方案通过对推理过程中关键数据结构——键值缓存引入分层架构,能够基于系统可用资源实现最大速度优化。

在正式发布前,UCM已历经长期实际测试。华为数据存储产品副总裁周跃峰透露,该技术已在中国银联完成实际业务验证。科技媒体Gizmochina指出,测试场景涵盖“客户语音分析、营销策划及办公辅助”等领域。数据显示,相比传统缓存存储技术,采用UCM的系统在AI推理时延降低达90%,吞吐量提升22倍

这项突破性技术或将成为中国AI市场的重大利好。当前中国AI产业正竭力寻求不依赖高带宽内存的替代方案。HBM作为堆叠式高速存储器,对AI训练推理至关重要,能为类似英伟达高性能计算服务器中的AI芯片提供高吞吐量与低延迟支持。

然而中国获取HBM极其困难。这类芯片几乎全部由韩国SK海力士三星及美国美光科技垄断。美国政府持续阻挠中国采购或自产HBM的尝试,限制HBM获取已成为美国在“芯片战争”中的核心战略——该政策在拜登特朗普两届政府任内持续推进。

UCM的发布正值中国加速推进技术自主、摆脱西方硬件依赖的关键时期。最新报道显示,中国中央政府正要求本土企业停购英伟达特供中国的阉割版AI芯片H20。这对数月来不断游说美国政府批准对华销售H20英伟达构成新的打击——其首席执行官黄仁勋上月刚在海湖庄园百万美元晚宴后重获销售许可。

美国原拟通过控制英伟达芯片供应延缓中国技术进步,但随着中国官方明确抵制H20芯片,加之华为突破HBM依赖的技术进展,这一战略恐将面临失效风险。


文章标签: #华为 #人工智能 #芯片战 #技术创新 #自主可控

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。