全球人工智能推理基础设施领域的领军企业Rebellions宣布,将与SK电讯(SKT)及Arm公司合作,共同开发旨在支持主权人工智能及专注于电信领域的人工智能数据中心的人工智能推理基础设施。通过此次合作,各方计划开发一款结合了Arm AGI CPU(首款由Arm设计的数据中心CPU)与Rebellions人工智能芯片的人工智能服务器。该系统将在SKT的人工智能数据中心环境中进行验证,随后推向全球市场。

这一汇集了人工智能基础设施各领域行业领导者的联盟,旨在应对推理市场激增的需求,并为高性能、高能效的主权人工智能基础设施设定标准。各方计划在从基础设施设计到实际部署与验证的整个价值链上进行合作。
作为该计划的一部分,基于Arm Neoverse CSS V3平台构建的Arm AGI CPU将与Rebellions的RebelCard加速器相结合,构成高性能服务器基础设施。除了硬件集成,合作伙伴还将共同开发包括固件在内的整个软件栈,并将开发的解决方案部署在SKT的实际数据中心环境中,以验证其在主权人工智能模型和电信专用大规模数据处理方面的性能与稳定性。各方计划评估在SKT专有基础模型A.X K1上运行这些服务器的可能性。
Rebel-Quad的部分特性包括:
能效与性能:更高的计算密度和利用率,带来显著更优的每瓦性能。
芯粒互连:全球率先采用UCIe-Advanced标准,实现跨芯粒的高能效数据传输。
HBM3E集成:集成144GB HBM3E内存,带宽达4.8TB/秒,足以支持单芯片运行数百亿参数模型。
在完成技术验证后,合作伙伴计划探索更广泛的商业部署机会。通过此举,Rebellions旨在为全球主权人工智能数据中心市场提供优化解决方案,并确立强大的市场地位,尤其是在亚洲地区。具体而言,重点将是为需要独立人工智能基础设施的全球电信公司和公共部门提供经过稳定性验证的定制化解决方案。
关于Rebellions RebelCard:
Rebellions RebelCard是一款模块化卡式产品,搭载了Rebellions的下一代人工智能半导体“Rebel 100”(此前称为Rebel-Quad)。它集成了四个神经处理单元芯粒和第五代高带宽内存,可提供卓越的计算能力。在确保性能与当前旗舰级GPU相当的同时,其能效更胜一筹,满足了大规模人工智能数据中心对能源和成本优化的需求。通过高速芯片间通信技术,它专门针对运行超大规模多模态模型和专家混合模型进行了优化。



