谷歌升级Gemini应用，新增实时AI视频，深度研究等功能

在2025年谷歌开发者大会上，谷歌宣布对Gemini人工智能聊天机器人应用进行多项升级，包括更广泛可用的多模态AI功能、更新的AI模型以及与谷歌产品套件的深度整合。

Cover Image

从本周二开始，谷歌将向所有iOS和安卓用户开放Gemini Live的摄像头和屏幕共享功能。这项由Astra项目驱动的功能允许用户与Gemini进行近乎实时的语音对话，同时将智能手机摄像头或屏幕画面实时传输给AI模型。举例来说，当用户在新城市漫步时，可以用手机对准建筑物询问Gemini Live相关建筑风格或历史背景，几乎能即时获得解答。

谷歌表示未来数周内，Gemini Live将深度整合其他应用。该功能很快就能调用谷歌地图提供导航指引、在谷歌日历创建日程、通过谷歌任务生成待办清单。

这波更新是谷歌与OpenAI的ChatGPT、苹果（Apple）的Siri及其他数字助手服务商竞争的重要举措。AI聊天机器人的兴起为用户提供了与互联网及设备交互的新方式，这对包括谷歌搜索和谷歌助理在内的多个科技巨头业务形成压力。谷歌在2025开发者大会上透露，Gemini月活跃用户已达4亿，公司显然希望通过这些更新进一步扩大用户基础。

谷歌同步推出两项新订阅服务：每月145.4元人民币（20美元）的Google AI Pro（原Gemini Advanced套餐更名），以及对标ChatGPT Pro的每月1817.5元人民币（250美元）Google AI Ultra套餐。Ultra用户将享有超高调用限额、新模型优先体验权及独家功能使用权。

谷歌周二同时宣布，选择英语作为Chrome浏览器语言的Pro和Ultra美国订阅用户，将可在浏览器内直接调用Gemini。这项整合旨在让用户随时要求Gemini总结屏幕内容或解答相关问题。

谷歌表示正在升级深度研究功能——这是Gemini生成详尽研究报告的AI代理，现支持用户上传私人PDF和图片。该功能会将私人文件与公开数据交叉比对，生成更具个性化的报告。公司透露后续将直接整合云端硬盘和Gmail至深度研究功能。

免费用户将获得升级后的AI图像模型Imagen 4，据称能生成更精准的文本内容。而每月250美元的Ultra套餐订阅者还能体验谷歌最新AI视频模型Veo 3，该模型通过原生音频生成技术创造与视频场景匹配的音效。

谷歌同时将Gemini默认模型更新为Gemini 2.5 Flash，官方宣称该模型能在更低延迟下提供更高质量的响应。

为满足日益增长的学生用户需求，Gemini现可针对用户薄弱环节生成个性化测验。当用户答错问题时，系统会自动生成补充测验和改进方案以强化相关知识。

搜索结果如下

阅读全文

谷歌升级Gemini应用，新增实时AI视频，深度研究等功能

也可以看看

Prime Video动作剧集口碑爆棚，《黑袍纠察队》两周后回归更值得期待

阅读全文

苹果采取外交策略，采购长江存储NAND芯片，专供中国版iPhone

阅读全文

恐怖游戏《信仰：不洁三位一体》将改编电影，内容创作者进军制片业

阅读全文