Google DeepMind正式推出Gemini 2.5 Deep Think,该公司宣称这是其最先进的人工智能推理模型,能够通过同步探索多种思路并综合输出结果来选择最佳答案。自周五起,订阅Google每月250美元Ultra服务的用户即可在Gemini应用中体验该功能。

Cover Image

作为Google首个公开的多智能体模型,Gemini 2.5 Deep Think最初于2025年5月Google I/O大会上亮相。这类系统能同时生成多个AI智能体并行处理问题,虽然计算资源消耗远超单智能体模式,但通常能产生更优质的解决方案。Google曾凭借该模型的变体版本,在今年国际数学奥林匹克竞赛(IMO)中斩获金牌。

除面向公众的版本外,Google还将向特定数学家及学术研究者开放参赛用的专用模型。该公司指出,这个需要“数小时推理”的学术模型与普通消费级AI秒级响应的特性截然不同,期望借此推动学术研究,并收集多智能体系统在学术场景的优化建议。

相较于I/O大会公布的版本,Gemini 2.5 Deep Think实现了显著升级。Google声称开发了“新型强化学习技术”以优化模型的推理路径利用效率。“Deep Think能协助人类解决需要创造性思维、战略规划和渐进式改进的复杂问题。”该公司在向TechCrunch提供的博客文章中表示。

该模型在衡量AI综合能力的Humanity's Last Exam(HLE)测试中创下34.8%的当前最佳成绩(无工具辅助),远超xAIGrok 4(25.4%)OpenAIo3(20.3%)。在编程竞赛测试LiveCodeBench6中,其87.6%的得分同样领先于Grok 4(79%)o3(72%)

Gemini 2.5 Deep Think可自动调用代码执行和Google搜索等工具,并能生成比传统AI更详尽的回复。测试表明,该模型在网页开发任务中产出的方案兼具细节美感与实用性,有望为科研人员“加速探索进程”。

目前主流AI实验室正集体转向多智能体架构:Elon MuskxAI近期推出同类系统Grok 4 HeavyOpenAI研究员Noam Brown证实其未公开的IMO夺冠模型也采用该技术;Anthropic的研究简报生成工具同样基于多智能体系统。不过这类系统运营成本高昂,科技公司可能延续xAIGoogle现行的策略——仅向高端订阅用户开放。

Google宣布未来数周将通过Gemini API向特定测试者开放Gemini 2.5 Deep Think,以深入探索开发者和企业级应用场景。


文章标签: #AI #谷歌 #多智能体 #推理模型 #Gemini

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。