本周,中国人工智能实验室深度求索因其聊天机器人应用登顶苹果应用商店(Apple App Store)和谷歌应用商店(Google Play)排行榜而进入了主流视野。深度求索的人工智能模型采用了计算效率高的训练技术,这让华尔街分析师和技术专家们开始质疑美国是否能在人工智能竞赛中保持领先地位,以及人工智能芯片的需求是否能够持续。

Cover Image

但深度求索从何而来,又是如何如此迅速地登上国际舞台的呢?

深度求索的交易背景

深度求索由高飞资本管理(High-Flyer Capital Management)支持,这是一家中国量化对冲基金,利用人工智能辅助其交易决策。人工智能爱好者梁文峰于2015年与他人共同创办了高飞资本。据报道,梁文峰在浙江大学读书时就开始涉足交易,并于2019年正式成立高飞资本管理公司,专注于开发和部署人工智能算法。

2023年,高飞资本成立了深度求索实验室,致力于研究与金融业务分离的人工智能工具。在高飞资本作为其投资者之一的情况下,该实验室独立成为一家名为深度求索的公司。

从一开始,深度求索就建立了自己的数据中心集群用于模型训练。但与其他中国人工智能公司一样,深度求索也受到了美国硬件出口禁令的影响。为了训练其最新模型之一,该公司被迫使用英伟达(Nvidia)的H800芯片,这是与美国公司可用的H100芯片相比性能较弱的版本。

据称,深度求索的技术团队偏向年轻化。据报道,该公司积极从中国顶尖大学招聘博士级人工智能研究人员。《纽约时报》称,深度求索还雇佣了没有任何计算机科学背景的人,以帮助其技术更好地理解广泛的主题。

深度求索的强大模型

深度求索于2023年11月推出了第一组模型,包括深度求索编程助手(DeepSeek Coder)、深度求索大语言模型(DeepSeek LLM)和深度求索聊天机器人(DeepSeek Chat)。但直到去年春天,当这家初创公司发布了下一代深度求索V2系列模型时,人工智能行业才开始注意到它。

深度求索V2是一款通用的文本和图像分析系统,在各种人工智能基准测试中表现出色,并且运行成本远低于当时的同类模型。这迫使深度求索的国内竞争对手,包括字节跳动(ByteDance)和阿里巴巴(Alibaba),降低了其部分模型的使用价格,并使其他模型完全免费。

2024年12月推出的深度求索V3进一步提升了深度求索的知名度。

根据深度求索的内部基准测试,深度求索V3的表现优于Meta的Llama等可下载的开源模型,以及只能通过API访问的“封闭”模型,如OpenAI的GPT-4o。

同样令人印象深刻的是深度求索的R1“推理”模型。该模型于1月发布,深度求索声称R1在关键基准测试中的表现与OpenAI的o1模型相当。

作为推理模型,R1能够有效地自我事实核查,这有助于避免一些通常困扰模型的问题。与典型的非推理模型相比,推理模型需要更长的时间(通常多出几秒到几分钟)来得出解决方案。但好处是,它们在物理、科学和数学等领域往往更加可靠。

然而,R1、深度求索V3以及深度求索的其他模型也存在一个缺点。作为中国开发的人工智能,它们需要接受中国互联网监管机构的基准测试,以确保其回答“体现社会主义核心价值观”。例如,在深度求索的聊天机器人应用中,R1不会回答有关天安门广场或台湾自治的问题。

颠覆性的策略

如果说深度求索有商业模式,那么目前尚不清楚其具体是什么。该公司的产品和服务定价远低于市场价值,甚至有些是免费提供的。尽管有大量的风险投资兴趣,深度求索也没有接受投资者的资金。

根据深度求索的说法,效率突破使其保持了极端的成本竞争力。然而,一些专家对该公司提供的数据表示质疑。

无论如何,开发者们已经接受了深度求索的模型。虽然这些模型并不像通常理解的那样开源,但在允许商业使用的宽松许可下是可用的。据深度求索模型托管平台之一Hugging Face的首席执行官克莱姆·德兰格(Clem Delangue)称,Hugging Face上的开发者已经创建了超过500个R1的衍生产品模型,累计下载量达250万次。

深度求索在对抗更大、更成熟的竞争对手时所取得的成功被描述为“颠覆人工智能”和“过度炒作”。该公司的成功至少在一定程度上导致了英伟达股价在1月份下跌18%,并引发了OpenAI首席执行官山姆·阿尔特曼(Sam Altman)的公开回应。

微软(Microsoft)宣布深度求索已在其Azure AI Foundry服务上线,这是微软的统一企业AI服务平台。在第一季度财报电话会议上,当被问及深度求索对Meta人工智能支出的影响时,首席执行官马克·扎克伯格(Mark Zuckerberg)表示,AI基础设施的支出将继续是Meta的“战略优势”。3月,OpenAI称深度求索为“国家补贴”和“国家控制”,并建议美国政府考虑禁止深度求索的模型。

在英伟达第四季度财报电话会议上,首席执行官黄仁勋(Jensen Huang)强调了深度求索的“卓越创新”,并表示它和其他“推理”模型对英伟达非常有利,因为它们需要更多的计算资源。

与此同时,一些公司正在禁止深度求索,包括韩国在内的国家和政府也是如此。纽约州也禁止在政府设备上使用深度求索。

至于深度求索的未来如何,目前尚不清晰。改进模型是必然的。但美国政府似乎对其认为有害的外国影响力越来越警惕。《华尔街日报》3月报道称,美国可能会禁止在政府设备上使用深度求索。


文章标签: #AI #聊天 #竞争 #模型 #创新

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。