中国深度求索(DeepSeek)公司即将向市场投放新模型“DeepSeek R2”的细节已在网络曝光,这或将再次搅动人工智能市场格局。据悉,该模型主要基于华为AI芯片进行训练。

Cover Image

深度求索的首个主流模型R1曾向西方世界证明,中国在高端AI模型开发领域丝毫不落下风。该产品的发布不仅导致美国股市估值蒸发人民币数百亿元(约合数十亿美元),更揭示了开发AI模型的实际成本远低于OpenAI等公司向公众披露的数字。如今中国媒体开始报道关于R2模型的传闻,西方AI市场很可能将再次迎来来自东方的震撼性突破。

据中国消息源透露,R2模型将采用混合专家系统(MoE)架构的进阶版本,可能整合了先进的门控机制或稠密层结构,参数量将达到R1的两倍——1.2万亿规模

仅从参数规模看,R2已可对标GPT-4 Turbo和谷歌Gemini 2.0 Pro。但深度求索的突破不止于此:报道称R2的单token成本比GPT-4降低97.4%,输入token单价仅0.5元/M($0.07/M),输出token单价1.9元/M($0.27/M)。相比OpenAI的定价体系,R2将成为企业用户最具性价比的选择,或将重塑AI经济生态。

值得注意的是,R2模型在华为昇腾910B芯片集群上实现了82%的利用率,FP16精度下算力达512千万亿次。这表明深度求索确实选择用国产化方案打造新一代主流模型。这家中国AI公司对华为芯片的深度应用,实质上完成了AI产业链的垂直整合。

当前关于R2的所有信息仍属推测,最终产品可能存在差异。但根据中国媒体披露的信息,这极可能又是一款让主流AI厂商措手不及的产品。


文章标签: #人工智能 #大模型 #华为芯片 #AI成本 #中国科技

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。