阿里巴巴发布了其最新AI芯片Zhenwu M890和AI大模型Qwen3.7-Max,专为代理式AI工作负载设计。在代理式AI热潮持续升温之际,阿里巴巴推出了自研AI芯片及AI大模型:Zhenwu M890 GPU与Qwen3.7-Max模型。

阿里巴巴的Zhenwu M890基于公司自研的PPU(并行处理单元)架构,并集成了Transformer核心引擎。该芯片专为代理式AI工作负载设计,侧重于AI推理,可提供0.6 PFLOPs的FP16(半精度)算力,与英伟达的A100相当,且速度是Hopper H20解决方案的三倍。阿里巴巴还表示,M890 AI芯片的算力是上一代产品的三倍。
在规格方面,Zhenwu M890配备了144 GB的HBM3内存,较配备96 GB内存的Zhenwu 810E提升了50%。互联带宽也提升至800 GB/s,较810E芯片增加了100 GB/s。此外,新芯片支持FP32、FP16、FP8和FP4格式,适用于AI工作负载。这使得该芯片在能力上与英伟达的Rubin和华为的昇腾950(Ascent 950)系列不相上下。
阿里巴巴在推出新互联芯片ICN Switch 1.0的同时,还提供了完整的生态系统。该芯片可提供25.6 Tb/s的互联速度,点对点时延低于150纳秒。更高的带宽支持大规模智能体并发。此外,还有倚天Arm架构主机CPU(Yitian Arm-based host CPU)和盘脉(Panmai)系列网卡,它们将共同集成在阿里云的磐久AL128超级节点服务器(Panjiu AL128 Supernode Server)中。
这款新服务器将在单个机架内紧密集成128个AI加速器,提供PB/s级的带宽。平头哥(T-Head)报告称,迄今已出货约56万颗Zhenwu AI芯片,拥有超过400家外部客户,覆盖20个行业。
阿里巴巴的芯片路线图展示了清晰的代际演进:
2024年二季度发布的Zhenwu 810E:作为基线产品,是一款易于使用的训练与推理一体化AI芯片,配备96GB内存和700GB/s互联带宽。
2026年二季度发布的Zhenwu M890:采用全面升级的自研并行计算架构,性能为前代三倍,配备144GB内存和800GB/s互联带宽。整体性能提升约三倍,内存从96GB增至144GB(+50%),带宽从700提升至800GB/s(+14%),架构全面升级。
2027年三季度计划推出的Zhenwu V900:将采用深度迭代的自研并行计算架构,性能再提升三倍,配备216GB内存和1200GB/s互联带宽。性能再度提升三倍,内存从144GB增至216GB(+50%),带宽从800提升至1200GB/s(+50%),架构深度迭代。
展望未来,阿里云正在开发M890之后的系列Zhenwu芯片。明年三季度,公司计划推出V900,该芯片将采用更新架构,性能提升三倍,配备216 GB内存和1200 GB/s带宽。后续的Zhenwu J900将于2028年三季度推出,届时将带来更多架构和性能方面的更新。
该模型在多个领域展现出卓越的智能体能力。作为前沿的编码助手,它支持从快速前端原型设计到复杂的多文件软件工程等各类编码任务。为提升办公效率,它能够可靠地编排多智能体工作流,以处理复杂操作。值得注意的是,Qwen3.7-Max可自主执行长周期智能体任务,持续运行长达35小时,并管理超过1000次工具调用而性能不减。
该模型经过深度优化,兼容领先的智能体框架,包括OpenClaw、Hermes Agent、Claude Code、Qwen Paw和Qoder,可作为不同智能体系统的可靠基座。该模型在编码、通用智能体、通用能力和多语言等多个主要基准测试中均取得顶尖成绩,使其具备与领先前沿模型竞争的实力。该模型将很快通过阿里巴巴的模型服务平台Model Studio向全球开发者提供。
在关键基准测试中,Qwen3.7-Max在多个维度表现出色,在编码智能体基准测试中,Terminal Bench 2.0得分为69.7,SWE-Verified得分为80.4,SWE-Pro得分为60.6,SWE-Multilingual得分为78.3,NL2repo得分为47.2,SciCode得分为53.5,WebDev得分为1568,SVG得分为1568,均处于行业领先水平。
除芯片外,阿里云还发布了其最新AI大模型Qwen3.7-Max。该模型专注于高级智能体编码、复杂推理和长周期任务执行。这款新模型将很快向开发者和企业开放。



