谷歌推出Gemini深度思考AI，并行推理多思路模型

Google DeepMind正式推出Gemini 2.5 Deep Think，该公司宣称这是其最先进的人工智能推理模型，能够通过同步探索多种思路并综合输出结果来选择最佳答案。自周五起，订阅Google每月250美元的Ultra服务的用户即可在Gemini应用中体验该功能。

Cover Image

作为Google首个公开的多智能体模型，Gemini 2.5 Deep Think最初于2025年5月的Google I/O大会上亮相。这类系统能同时生成多个AI智能体并行处理问题，虽然计算资源消耗远超单智能体模式，但通常能产生更优质的解决方案。Google曾凭借该模型的变体版本，在今年国际数学奥林匹克竞赛（IMO）中斩获金牌。

除面向公众的版本外，Google还将向特定数学家及学术研究者开放参赛用的专用模型。该公司指出，这个需要“数小时推理”的学术模型与普通消费级AI秒级响应的特性截然不同，期望借此推动学术研究，并收集多智能体系统在学术场景的优化建议。

相较于I/O大会公布的版本，Gemini 2.5 Deep Think实现了显著升级。Google声称开发了“新型强化学习技术”以优化模型的推理路径利用效率。“Deep Think能协助人类解决需要创造性思维、战略规划和渐进式改进的复杂问题。”该公司在向TechCrunch提供的博客文章中表示。

该模型在衡量AI综合能力的Humanity's Last Exam（HLE）测试中创下34.8%的当前最佳成绩（无工具辅助），远超xAI的Grok 4（25.4%）和OpenAI的o3（20.3%）。在编程竞赛测试LiveCodeBench6中，其87.6%的得分同样领先于Grok 4（79%）与o3（72%）。

Gemini 2.5 Deep Think可自动调用代码执行和Google搜索等工具，并能生成比传统AI更详尽的回复。测试表明，该模型在网页开发任务中产出的方案兼具细节美感与实用性，有望为科研人员“加速探索进程”。

目前主流AI实验室正集体转向多智能体架构：Elon Musk的xAI近期推出同类系统Grok 4 Heavy；OpenAI研究员Noam Brown证实其未公开的IMO夺冠模型也采用该技术；Anthropic的研究简报生成工具同样基于多智能体系统。不过这类系统运营成本高昂，科技公司可能延续xAI和Google现行的策略——仅向高端订阅用户开放。

Google宣布未来数周将通过Gemini API向特定测试者开放Gemini 2.5 Deep Think，以深入探索开发者和企业级应用场景。

搜索结果如下

阅读全文

谷歌推出Gemini深度思考AI，并行推理多思路模型

也可以看看

《星际公民》4.7版更新，引入制造系统，玩家可操控巨型激光钻探小行星

阅读全文

《霍格沃茨之遗2》官方消息更新，粉丝期待值拉满

阅读全文

Prime Video周末必看，新犯罪惊悚剧与热门剧集推荐

阅读全文