尼古拉斯·凯奇克苏鲁恐怖片,登陆Hulu流媒体平台
阅读全文

锤刻创思寰宇网
基础模型究竟有多重要?这或许听起来像是个愚蠢的问题,但在我与人工智能初创企业的对话中,这个话题反复出现。这些企业如今对曾被贬称为“GPT套壳”的业务模式越来越适应——即基于现有AI模型(如ChatGPT)构建应用界面的公司。当下初创团队更专注于针对特定任务进行模型定制和界面开发,将基础模型视为可随时替换的通用组件。这种趋势在上周的Boxworks大会上尤为明显,整个会议似乎完全聚焦于构建在AI模型之上的用户端软件。
部分驱动因素在于:预训练(即使用海量数据集训练AI模型的初始过程,这是基础模型的专属领域)的规模效益正在放缓。这并非意味着AI发展陷入停滞,而是超大规模基础模型的早期红利已出现收益递减,行业注意力正转向后训练和强化学习领域。若想开发更优秀的AI编程工具,将资源投入微调技术和界面设计远比花费数十亿美元服务器成本进行预训练更明智。正如Anthropic公司的Claude Code所证明的,基础模型公司在这些领域同样表现出色——但这类优势已不像过去那样具有持久性。
简而言之,AI领域的竞争格局正在发生根本性变化,这种变化正在削弱大型AI实验室的优势。与其追求开发能在所有认知任务上匹配或超越人类能力的全能AGI(通用人工智能),不如着眼于眼前纷繁多样的细分市场:软件开发、企业数据管理、图像生成等。除了先发优势外,构建基础模型能否在这些领域带来额外优势尚不明朗。更严峻的是,开源替代方案的泛滥意味着,如果基础模型在应用层竞争中失利,它们将失去定价权。这将使OpenAI和Anthropic这类公司沦为低利润通用业务的后端供应商——正如某位创始人对我说的:“就像向星巴克销售咖啡豆”。
这种转变对AI产业的影响无论怎样强调都不为过。在本轮AI热潮中,人工智能的成功始终与基础模型构建企业的成败紧密相连——特别是OpenAI、Anthropic和谷歌。看好AI就意味着相信其变革性影响将使这些公司成为划时代的重要企业。我们或许会争论哪家公司将最终胜出,但当时普遍认为某些基础模型公司终将掌握行业命脉。
这种观点曾有多重依据:多年来,基础模型开发是AI领域唯一的业务方向——快速的技术进步使其领先优势看似不可逾越。硅谷始终对平台优势有着根深蒂固的迷恋,人们假设无论AI模型通过何种方式盈利,大部分利益终将回流至基础模型公司,因为它们完成了最难以复制的核心工作。
过去一年让这个叙事变得复杂起来。虽然涌现了大量成功的第三方AI服务,但它们往往可以互换使用不同基础模型。对初创企业而言,其产品基于GPT-5、Claude还是Gemini已不再重要,它们甚至期望能在产品发布中期切换模型而不被终端用户察觉。尽管基础模型仍在持续进步,但任何公司想要保持足够大的优势来统治整个行业,这种可能性已愈发渺茫。
我们已有充分证据表明先发优势并不明显。正如a16z风险投资家马丁·卡萨多(Martin Casado)最近在播客中指出的,OpenAI最早推出了编程模型以及图像、视频生成模型,但在这三个领域都输给了竞争对手。“就我们所见,AI技术栈中并不存在固有的护城河,”卡萨多总结道。
当然,我们不应现在就将基础模型公司排除在外。它们仍拥有诸多持久优势,包括品牌认知度、基础设施和难以想象的巨额现金储备。OpenAI的消费者业务可能比其编程业务更难复制,随着行业成熟还可能出现其他优势。鉴于AI发展的快节奏,当前对后训练的关注很可能在六个月内发生逆转。最不确定的是,通用智能的竞赛可能在新药研发或材料科学领域取得突破,彻底改变我们对AI模型价值的认知。
但就目前而言,构建更庞大基础模型的策略相比去年已吸引力大减——Meta耗资数十亿美元的豪赌正开始显得异常危险。