谷歌(Google)即将推出一款注重效能优化的新型AI模型。这款名为“双子座2.5闪电版”(Gemini 2.5 Flash)的模型将很快登陆谷歌AI开发平台Vertex AI。该公司宣称该模型提供“动态可控”的计算能力,开发者可根据查询复杂度灵活调整处理时长。
“用户能根据具体需求,在速度、精度和成本之间取得最佳平衡,”谷歌在提供给TechCrunch的博客文章中写道,“这种灵活性对于在高吞吐量、成本敏感型应用中优化闪电版性能至关重要。”
随着旗舰级AI模型成本持续攀升,双子座2.5闪电版这类兼顾性能与价格优势的模型,以适度牺牲准确率为代价,为市场提供了极具吸引力的替代方案。该模型定位为“推理型”模型,与OpenAI的o3-mini及深度求索(DeepSeek)的R1属同类产品,其特点是通过延长响应时间来实现自我事实核查。
谷歌表示,2.5闪电版特别适合客服系统和文档解析等需要“高吞吐量”和“实时响应”的应用场景。“这款主力机型专为降低延迟和缩减成本而优化,”谷歌在博客中强调,“对于响应式虚拟助手和实时摘要工具这类规模效益至上的应用而言,它堪称理想引擎。”
值得注意的是,谷歌未发布双子座2.5闪电版的安全或技术报告,这使得外界难以全面评估该模型的优势与局限。该公司此前向TechCrunch解释称,对于尚处“实验阶段”的模型通常不予发布相关报告。
谷歌同时宣布,计划从第三季度开始将2.5闪电版等双子座模型引入本地化部署环境。这些模型将通过谷歌分布式云(GDC)平台提供服务,该方案专为数据治理要求严格的客户设计。谷歌透露正与英伟达(Nvidia)合作,将双子座模型适配符合GDC标准的Blackwell系统,客户可通过谷歌或其指定渠道采购这些硬件解决方案。