一份新报告声称,深度求索(DeepSeek)在训练和开发其最新大语言模型的过程中,非法获取并运行了“数千”块英伟达(Nvidia)Blackwell GPU。根据The Information的报道,六位匿名消息人士均声称深度求索参与了一个复杂的走私网络,该网络以虚假数据中心为幌子,将高性能服务器运入中国大陆,从而非法规避美国对新型AI GPU的制裁。

接近此事的相关人士指控称,深度求索参与了一个高度复杂的走私网络,该网络专注于通过使用虚假数据中心,将Blackwell芯片非法运入中国。空壳公司在东南亚某地购买相当于一整个数据中心规模的英伟达服务器,完全按照规格要求建立数据中心及其硬件。英伟达的OEM合作伙伴会派遣承包商检查安装情况,确认安装成功并符合出口规定。
据报道,在此检查完成后,走私者会将整个数据中心逐机架拆解,将GPU服务器装入行李箱,通过边境运入中国大陆——在那里,某些英伟达芯片的购买和使用受到美国政府的限制。根据报道,了解这些走私活动的消息人士声称,走私者和客户更青睐像HGX B200这样的8-GPU机架服务器,而非功能更强大的GB200 NVL72,原因是前者尺寸更小,便于隐蔽运输。
当被要求置评时,一位英伟达发言人向媒体提供了以下声明:“我们尚未看到任何证据或收到关于存在‘幽灵数据中心’的线索——即有人建造数据中心来欺骗我们和我们的OEM合作伙伴,然后将其拆解、走私并在其他地方重建。尽管此类走私行为似乎不太可能,但我们会对收到的任何线索进行追查。”
深度求索对英伟达 GPU的需求
深度求索是美国最知名的中国AI公司,这要归功于其R1大语言模型在一年前成为全球头条新闻,该公司长期以来一直与英伟达 GPU联系在一起。其引起轰动的R1模型仅用2,048块英伟达H800在两个月内完成训练,其GPU数量远少于任何西方竞争对手,且效率更高。自那时起,深度求索就不断被报道与尽可能多地囤积和购买英伟达 GPU有关,不断有传闻称该公司以某种方式绕过出口限制,获取了大量最新的英伟达芯片。
有趣的是,深度求索最新的内部报告似乎表明,计划为其最新的AI模型使用英伟达芯片。在12月2日发布的关于DeepSeek V3.2的白皮书中,深度求索提出,其性能瓶颈(与Gemini-3.0-Pro等前沿模型相当)在于预训练算力;“我们计划在未来版本中,通过扩大预训练算力规模来解决这一知识差距。”预训练计算是英伟达 GPU和CUDA软件比大多数其他竞争对手表现更出色的工作流程,这表明深度求索的工程师们指望在获取高水平预训练算力方面能有所改变。
深度求索的过往记录证明,英伟达的预训练能力填补了中国国内产品无法匹敌的空白。有报道称,8月份时华为的昇腾(Ascend) GPU服务器无法运行必要的训练工作负载,促使在R2训练过程中重新使用英伟达硬件。尽管有政府干预和政策呼吁深度求索为其AI工作负载转向中国国内产品,但情况依然如此。虽然华为昇腾服务器被用于模型的推理,但该公司除了转向英伟达外别无他法,这令中国方面颇为懊恼。
英伟达在中国的未来
特朗普政府近期宣布计划解除对英伟达H200 GPU在中国的限制,为英伟达在该国的销售打开大门。分析人士称,白宫这一政策逆转(其在2025年大部分时间里都坚持对中国实行完全出口孤立主义)源于对华为CloudMatrix 384和Ascend 910C系统日益增长的担忧。有可靠说法认为,这些服务器在某些性能指标上可与H200和GB200 NVL72匹敌,促使美国政府向中国放行H200。
这项新政策是基于两种极端做法之间的妥协:一是用易于获取的美国英伟达技术淹没中国,二是完全禁止。其希望是满足中国对技术的需求,并消除像华为这样的公司开发自己英伟达竞争对手的动力。这一信条(常被英伟达对白宫的游说所鼓吹)的采用,标志着北京和华盛顿之间“芯片战”贸易攻势的重大转变,已从阻止中国获得任何下一代技术,转向希望减缓中国开始威胁西方技术主导地位的技术实力。
尽管特朗普政府的商务部继续坚称中国永远不会获得英伟达Blackwell硬件,将出口例外仅限于H200等Hopper架构硬件,但时间将证明,英伟达进一步的游说以及对中国科技行业的担忧是否会进一步打开大门。当然,如果深度求索真的参与了幽灵数据中心的阴谋,他们甚至不需要美国允许他们获得Blackwell。



