2025年,中国人工智能实验室DeepSeek(深思)发布了一系列与OpenAI、Meta和谷歌等顶尖科技公司相媲美的人工智能模型的开放版本,引发了硅谷的首次“恐慌”。DeepSeek声称其模型的开发效率极高且速度极快,尽管这一说法引发了部分人的质疑,但其以远低于美国人工智能公司的价格提供这些模型,这一策略已经让硅谷的科技巨头们感到了巨大的压力。
DeepSeek的崛起不仅让科技公司感到不安,甚至引起了美国政府高层的关注。他们担心中国在人工智能竞赛中正在逐渐取得领先优势。对此,人工智能基础设施初创公司Anyscale的联合创始人罗伯特·西希拉(Robert Nishihara)在接受媒体采访时表示:“我不会感到惊讶,现在很多人工智能实验室可能正在召开‘作战会议’。”
DeepSeek的快速崛起标志着硅谷人工智能格局的一个重要转折点。人工智能公司的首席执行官、创始人、研究人员和投资者纷纷表示,DeepSeek的模型对美国人工智能政策产生了重大影响。此外,这些模型也显示出人工智能进步正在加速的迹象。
纽约大学数据科学中心助理教授拉维德·施瓦茨 - 齐夫(Ravid Shwartz - Ziv)在接受采访时表示:“当然,DeepSeek被过度炒作。但它仍然非常有趣,我们可以从中得到很多启示。”
DeepSeek在创建其R1模型时,采用了“纯强化学习”这一关键创新。斯坦福大学兼职讲师、Workera首席执行官基安·卡坦福鲁什(Kian Katanforoosh)将这种技术比作孩子通过试错来学习的过程。他解释说:“比如一个孩子不小心摸了热盘子被烫伤,他就会迅速学会不再去摸。这就是纯强化学习——基于反馈的试错学习。DeepSeek的方法完全依赖于让模型通过经验进行学习。”
事实上,DeepSeek在强化学习方面的应用似乎比其他尖端人工智能模型更为深入。OpenAI在开发o1时也使用了强化学习技术,该公司在DeepSeek宣布R1几周前公布了这一消息。OpenAI声称其即将推出的o3模型通过主要使用类似的方法以及额外的计算能力,实现了更好的性能。
斯坦福大学兼职讲师基安·卡坦福鲁什(Kian Katanforoosh)认为,强化学习是当今改进人工智能基础模型最有希望的方式之一。所谓“基础模型”,通常是指在大量数据(如网络上的图像和文本)上进行训练的人工智能模型。鉴于DeepSeek的成功,其他人工智能实验室似乎很可能会继续推动强化学习的极限,以改进他们的人工智能模型。
就在几个月前,人工智能公司还在努力提升其基础模型的性能。但强化学习等方法的成功,以及其他方法如监督微调和测试时扩展,表明人工智能的进步可能正在重新加速。人工智能研究所(Ai2)的研究员内森·兰伯特(Nathan Lambert)在接受TechCrunch采访时表示:“R1让我对保持高速进步的信心大增。”
R1可以在任何满足硬件要求的机器上下载和运行,它在许多人工智能基准测试中与o1相当甚至超越了o1。虽然这并非我们第一次看到像OpenAI这样的“封闭”模型与开放模型之间的性能差距缩小,但DeepSeek实现这一目标的速度让整个行业感到震惊。
这可能会推动美国增加对开放的、甚至是完全开源的人工智能的投资,以与中国竞争。安德森·霍洛维茨(a16z)的普通合伙人马丁·卡萨多(Martin Casado)告诉媒体,DeepSeek证明了过去两年的监管理由是多么“荒谬”。他认为,美国在技术能力上并不孤单,非常有竞争力的解决方案可能来自任何地方,但特别是中国。他强调:“我们不应该阻碍美国的创新,而应该大力投资。开源并不以某种方式使中国受益。事实上,禁止我们的公司进行开源意味着我们的技术无法广泛传播。”
卡萨多似乎是在提到前总统拜登最近被废除的人工智能行政令,以及被否决的加州法案SB 1047,a16z都强烈反对这两项措施。a16z认为这两项措施都优先考虑了防止“荒谬”的人工智能末日场景,而不是美国的创新。更广泛地说,硅谷在2024年成功压制了“人工智能末日运动”。a16z和其他人反复表示,围绕人工智能的真正担忧是美国可能会在与中国的人工智能竞赛中失去竞争优势。
鉴于DeepSeek的崛起,这种情景似乎更加真实。a16z在开放人工智能领域的许多最大参与者中都有大量投资,包括Databricks、Mistral和Black Forest Labs。这家风险投资公司也可能在特朗普政府的人工智能政策上发挥重要作用。a16z的前合伙人斯里拉姆·克里希南(Sriram Krishnan)现在是特朗普的人工智能高级政策顾问。
特朗普总统在周一表示,DeepSeek应该成为美国人工智能公司的“警钟”,同时赞扬这家中国人工智能实验室的开放方法。这与a16z在人工智能问题上的立场非常接近。a16z的联合创始人马克·安德森(Marc Andreessen)在X上的一篇帖子中提到:“DeepSeek R1是人工智能的‘斯普特尼克时刻’”,几十年前苏联发射地球轨道航天器推动美国认真投资其太空计划。 DeepSeek的崛起似乎也改变了开放人工智能怀疑论者的想法,比如前谷歌首席执行官埃里克·施密特(Eric Schmidt)。就在去年,施密特还对西方开放人工智能模型在全球范围内的传播表示担忧。但在周二发表的一篇专栏文章中,施密特表示DeepSeek的崛起标志着全球人工智能竞赛的一个“转折点”,并呼吁进一步投资美国开放人工智能。
DeepSeek通过更高效的模型推动了进步,并且进行了创新。人工智能研究所(Ai2)的研究员内森·兰伯特(Nathan Lambert)指出,与o1不同,R1向用户展示了其“思考过程”。他观察到,当看到人工智能推理模型的内部过程时,一些用户会更信任或相信这些模型,因为它们在“解释工作”。
现在,我们将不得不看看美国的政策制定者和人工智能实验室将如何回应。