EA多次拒绝BioWare,龙腾世纪复刻提案遭否决
阅读全文

锤刻创思寰宇网
Google DeepMind正式推出Gemini 2.5 Deep Think,该公司宣称这是其最先进的人工智能推理模型,能够通过同步探索多种思路并综合输出结果来选择最佳答案。自周五起,订阅Google每月250美元的Ultra服务的用户即可在Gemini应用中体验该功能。
作为Google首个公开的多智能体模型,Gemini 2.5 Deep Think最初于2025年5月的Google I/O大会上亮相。这类系统能同时生成多个AI智能体并行处理问题,虽然计算资源消耗远超单智能体模式,但通常能产生更优质的解决方案。Google曾凭借该模型的变体版本,在今年国际数学奥林匹克竞赛(IMO)中斩获金牌。
除面向公众的版本外,Google还将向特定数学家及学术研究者开放参赛用的专用模型。该公司指出,这个需要“数小时推理”的学术模型与普通消费级AI秒级响应的特性截然不同,期望借此推动学术研究,并收集多智能体系统在学术场景的优化建议。
相较于I/O大会公布的版本,Gemini 2.5 Deep Think实现了显著升级。Google声称开发了“新型强化学习技术”以优化模型的推理路径利用效率。“Deep Think能协助人类解决需要创造性思维、战略规划和渐进式改进的复杂问题。”该公司在向TechCrunch提供的博客文章中表示。
该模型在衡量AI综合能力的Humanity's Last Exam(HLE)测试中创下34.8%的当前最佳成绩(无工具辅助),远超xAI的Grok 4(25.4%)和OpenAI的o3(20.3%)。在编程竞赛测试LiveCodeBench6中,其87.6%的得分同样领先于Grok 4(79%)与o3(72%)。
Gemini 2.5 Deep Think可自动调用代码执行和Google搜索等工具,并能生成比传统AI更详尽的回复。测试表明,该模型在网页开发任务中产出的方案兼具细节美感与实用性,有望为科研人员“加速探索进程”。
目前主流AI实验室正集体转向多智能体架构:Elon Musk的xAI近期推出同类系统Grok 4 Heavy;OpenAI研究员Noam Brown证实其未公开的IMO夺冠模型也采用该技术;Anthropic的研究简报生成工具同样基于多智能体系统。不过这类系统运营成本高昂,科技公司可能延续xAI和Google现行的策略——仅向高端订阅用户开放。
Google宣布未来数周将通过Gemini API向特定测试者开放Gemini 2.5 Deep Think,以深入探索开发者和企业级应用场景。