在刚刚举办的摩尔线程(Moore Threads)MUSA开发者大会上,该公司公布了其下一代架构“华罡”(Huagang)。该架构预计于明年首次亮相,将同时覆盖游戏与人工智能领域,并承诺在这两方面带来显著的性能提升。此次发布会的具体细节不多,因此我们尚未获得任何确切规格参数,仅有关于未来预期的宣称。如果这些承诺属实,我们将迎来诸多值得期待的进步,例如“AAA级”游戏性能提升15倍,以及光线追踪性能大幅提升50倍。

首先来看基于“华罡”架构的新款游戏GPU“庐山”(Lushan),它将接替现有的MTT S80和S90型号。后者是摩尔线程一段时间以来提供的最佳GPU,但其性能仅勉强超过RTX 4060,因此一次彻底的革新早已势在必行。据摩尔线程宣称,“庐山”在“AAA级”游戏性能上(无论具体指光栅化性能还是其他方面)将实现15倍的提升,而光线追踪性能更是将获得高达50倍的惊人提升。
此外,该公司还宣称其在AI计算性能上将有64倍的增长,纹理几何处理提升16倍,纹理填充率提升4倍,原子访问性能提升8倍,显存容量提升4倍。作为参考,S80和S90搭载了16 GB的GDDR6显存,因此预计明年的“庐山”GPU将配备高达64 GB的显存,这在当前时期将是一个值得关注的看点。
摩尔线程新款GPU的另一项重要改进是对DirectX 12 Ultimate等现代API的全面支持,这应能缓解兼容性方面的顾虑。其配备了专用的第二代硬件光线追踪引擎,以及为“UniTE”统一渲染架构设计的新AI硬件模块,这有望使该GPU的渲染管线达到与英伟达(Nvidia)、AMD和英特尔(Intel)产品相当的水平。
除了“庐山”之外,摩尔线程还预告了“华山”(Huashan)AI GPU。该GPU采用双芯粒设计,并集成了8个HBM模块。其性能据称可与英伟达的Hopper和Blackwell GPU相媲美,内存带宽甚至超过了B200。该公司还宣称其计算密度提升了50%,能效提高了10倍。
“华山”支持从FP4到FP64的计算精度,并提供独有的低精度混合格式:MTFP4、MTFP6和MTFP8。在互联方面,摩尔线程计划将这些GPU扩展应用于AI工厂,通过MTLink 4.0互联技术,实现超过10万个GPU的互连,带宽高达1314 GB/s。
虽然我们尚未看到这些下一代GPU在游戏或AI方面的基准测试,但摩尔线程展示了MTT S5000 GPU运行深度求索(DeepSeek)V3模型的性能,在解码(Decode)阶段达到每秒1000个令牌,在预填充(Prefill)阶段达到每秒4000个令牌。这些结果使其略微领先于英伟达的Hopper产品线,后者历来是“绿队”在中国市场AI GPU的性能上限。
MTT S5000将于明年推出,但它并非“华山”系列的一部分,因为它此前已有相关报道。随着摩尔线程这家拥有国家背景的中国本土企业,正面向英伟达、英特尔和AMD等行业巨头发起正面挑战,我们应该在未来几个月内了解到更多关于MT“华罡”GPU的信息,这将有助于推动该地区的自主可控发展目标。



