中国人工智能实验室深度求索(DeepSeek)本周成为全球焦点——其聊天机器人应用登顶苹果应用商店与谷歌应用商店下载榜首。这家专注于高效计算技术训练AI模型的企业,正在引发华尔街分析师和科技界对美国AI领先地位的质疑,同时让市场重新审视AI芯片需求的可持续性。
这家中国AI新锐究竟有何独特之处?又是如何快速获得国际影响力的?
量化投资基因
深度求索(DeepSeek)由幻方量化(High-Flyer Capital Management)提供支持。这家中国量化对冲基金以AI技术辅助交易决策闻名。创始人梁文峰作为AI技术爱好者,早在2015年就参与创立幻方量化。该机构于2019年正式转型为对冲基金,专注于AI算法的开发与应用。
2023年,幻方量化成立深度求索实验室,专门从事与金融业务分离的AI工具研究。在母公司的持续投入下,该实验室于同年完成独立拆分,正式以深度求索(DeepSeek)品牌独立运营。
值得注意的是,深度求索自建了数据中心集群用于模型训练。但由于美国硬件出口禁令的限制,该公司在训练最新模型时只能使用英伟达H800芯片(H100芯片的降级版本)。
年轻化技术团队
《纽约时报》披露的团队构成显示,深度求索技术团队呈现显著年轻化特征。公司不仅从中国顶尖高校招募人工智能博士,还吸纳多学科背景人才,以增强技术对不同领域知识的理解能力。
模型性能突破
2023年11月,深度求索发布首套模型体系(包含DeepSeek Coder、DeepSeek LLM和DeepSeek Chat)。真正引发行业震动的是2024年春季推出的DeepSeek-V2系列模型。这款通用型文本-图像分析系统在多项AI基准测试中表现优异,且运行成本显著低于同类产品,直接促使字节跳动、阿里巴巴等国内企业下调模型服务价格。
2024年12月发布的DeepSeek-V3进一步巩固了技术优势。内部测试数据显示,该模型性能不仅超越Meta的Llama等开源模型,更优于OpenAI的GPT-4o等闭源API模型。
创新推理模型
2025年1月发布的R1"推理"模型成为新亮点。该模型在关键基准测试中达到与OpenAI的o1模型相当的水准。作为特殊设计的推理模型,R1具备自我事实核查功能,有效规避常规模型的常见缺陷。尽管生成结果需多耗费数秒至数分钟,但其在物理、科学、数学等领域的可靠性获得显著提升。
需要说明的是,这些模型均需接受网信部门基准测试,确保响应内容符合"社会主义核心价值观"。例如在聊天应用中,R1会主动规避涉及历史敏感话题和地区主权的问题。
独特商业模式
深度求索的商业模式至今保持神秘:其产品定价远低于市场水平,部分功能完全免费;面对众多风投机构的投资意向,公司始终未开启融资渠道。虽然公司宣称其效率突破带来了成本优势,但部分专家对公布数据的真实性存疑。
开发者社区展现出强烈热情。尽管不符合传统开源定义,但宽松的商业使用许可已吸引大量开发者。据托管平台Hugging Face首席执行官Clem Delangue透露,平台已衍生出500多个R1改进模型,累计下载量突破250万次。
行业影响与地缘博弈
深度求索的崛起引发多重连锁反应:英伟达股价在1月暴跌18%;OpenAI首席执行官山姆·阿尔特曼(Sam Altman)作出公开回应;3月美国商务部要求下属机构禁用其技术。微软宣布将深度求索纳入Azure AI Foundry服务,而Meta首席执行官马克·扎克伯格(Mark Zuckerberg)在财报会上强调继续加大AI基础设施投入。
值得注意的是,OpenAI在3月指控深度求索"受国家补贴与控制",建议美国政府考虑封禁。与此同时,韩国等国家及纽约州政府已明令禁止在政府设备使用该技术。
未来发展挑战
尽管模型持续升级迭代,但美国政府对其"潜在风险"的担忧持续升级。《华尔街日报》3月报道称,美政府可能全面禁止政府设备使用深度求索。这家中国AI企业的国际化道路仍面临诸多不确定性。