在2025年谷歌开发者大会上,谷歌宣布对Gemini人工智能聊天机器人应用进行多项升级,包括更广泛可用的多模态AI功能、更新的AI模型以及与谷歌产品套件的深度整合。
从本周二开始,谷歌将向所有iOS和安卓用户开放Gemini Live的摄像头和屏幕共享功能。这项由Astra项目驱动的功能允许用户与Gemini进行近乎实时的语音对话,同时将智能手机摄像头或屏幕画面实时传输给AI模型。举例来说,当用户在新城市漫步时,可以用手机对准建筑物询问Gemini Live相关建筑风格或历史背景,几乎能即时获得解答。
谷歌表示未来数周内,Gemini Live将深度整合其他应用。该功能很快就能调用谷歌地图提供导航指引、在谷歌日历创建日程、通过谷歌任务生成待办清单。
这波更新是谷歌与OpenAI的ChatGPT、苹果(Apple)的Siri及其他数字助手服务商竞争的重要举措。AI聊天机器人的兴起为用户提供了与互联网及设备交互的新方式,这对包括谷歌搜索和谷歌助理在内的多个科技巨头业务形成压力。谷歌在2025开发者大会上透露,Gemini月活跃用户已达4亿,公司显然希望通过这些更新进一步扩大用户基础。
谷歌同步推出两项新订阅服务:每月145.4元人民币(20美元)的Google AI Pro(原Gemini Advanced套餐更名),以及对标ChatGPT Pro的每月1817.5元人民币(250美元)Google AI Ultra套餐。Ultra用户将享有超高调用限额、新模型优先体验权及独家功能使用权。
谷歌周二同时宣布,选择英语作为Chrome浏览器语言的Pro和Ultra美国订阅用户,将可在浏览器内直接调用Gemini。这项整合旨在让用户随时要求Gemini总结屏幕内容或解答相关问题。
谷歌表示正在升级深度研究功能——这是Gemini生成详尽研究报告的AI代理,现支持用户上传私人PDF和图片。该功能会将私人文件与公开数据交叉比对,生成更具个性化的报告。公司透露后续将直接整合云端硬盘和Gmail至深度研究功能。
免费用户将获得升级后的AI图像模型Imagen 4,据称能生成更精准的文本内容。而每月250美元的Ultra套餐订阅者还能体验谷歌最新AI视频模型Veo 3,该模型通过原生音频生成技术创造与视频场景匹配的音效。
谷歌同时将Gemini默认模型更新为Gemini 2.5 Flash,官方宣称该模型能在更低延迟下提供更高质量的响应。
为满足日益增长的学生用户需求,Gemini现可针对用户薄弱环节生成个性化测验。当用户答错问题时,系统会自动生成补充测验和改进方案以强化相关知识。