DeepSeek R2模型传闻曝光，成本比GPT-4低97%，基于华为芯片训练

中国深度求索（DeepSeek）公司即将向市场投放新模型“DeepSeek R2”的细节已在网络曝光，这或将再次搅动人工智能市场格局。据悉，该模型主要基于华为AI芯片进行训练。

Cover Image

深度求索的首个主流模型R1曾向西方世界证明，中国在高端AI模型开发领域丝毫不落下风。该产品的发布不仅导致美国股市估值蒸发人民币数百亿元（约合数十亿美元），更揭示了开发AI模型的实际成本远低于OpenAI等公司向公众披露的数字。如今中国媒体开始报道关于R2模型的传闻，西方AI市场很可能将再次迎来来自东方的震撼性突破。

据中国消息源透露，R2模型将采用混合专家系统（MoE）架构的进阶版本，可能整合了先进的门控机制或稠密层结构，参数量将达到R1的两倍——1.2万亿规模。

仅从参数规模看，R2已可对标GPT-4 Turbo和谷歌Gemini 2.0 Pro。但深度求索的突破不止于此：报道称R2的单token成本比GPT-4降低97.4%，输入token单价仅0.5元/M（$0.07/M），输出token单价1.9元/M（$0.27/M）。相比OpenAI的定价体系，R2将成为企业用户最具性价比的选择，或将重塑AI经济生态。

值得注意的是，R2模型在华为昇腾910B芯片集群上实现了82%的利用率，FP16精度下算力达512千万亿次。这表明深度求索确实选择用国产化方案打造新一代主流模型。这家中国AI公司对华为芯片的深度应用，实质上完成了AI产业链的垂直整合。

当前关于R2的所有信息仍属推测，最终产品可能存在差异。但根据中国媒体披露的信息，这极可能又是一款让主流AI厂商措手不及的产品。

搜索结果如下

阅读全文

DeepSeek R2模型传闻曝光，成本比GPT-4低97%，基于华为芯片训练

也可以看看

苹果手表SE3或迎大屏升级，将推41和45毫米版本

阅读全文

PS Plus五月福利加码，三款大作免费入库

阅读全文

宏碁推600Hz电竞屏，刷新率破纪录

阅读全文