谷歌I/O大会(Google I/O)将至,Gemini将迎重大升级,有望全面超越ChatGPT和Claude。

预计谷歌将在Google I/O大会(Google I/O)上发布Gemini的重大AI更新,包括一个具备集成图像和视频生成能力的全新Gemini 4模型。据PCWorld报道,备受期待的功能包括用于提供个性化建议的“主动助手”(Proactive Assistant),以及代号为“雷米”(Remy)的升级版Gemini代理(Gemini Agent),用于提供全天候服务。这些进展旨在将Gemini从一个简单的聊天机器人转变为一个全面的个人助手,并可能为高级功能引入一个付费订阅层级。
当ChatGPT和Claude忙着发布新模型,以及那些让AI代理能够操控代码、你的设计甚至桌面的炫酷工具时,Gemini却一直——对于它的竞争对手来说,这或许充满了不祥之兆——异常安静。
诚然,最近Gemini也有一些有趣的发布,包括其令人印象深刻的Nano Banana 2图像生成器、Lyria 3(它能根据你的提示生成音乐曲目),以及一系列Google Workspace的集成功能。但在那些驻留在你电脑上的代理化办公工具,或是能听从你命令的自主AI代理方面,Gemini似乎落后于ChatGPT,尤其是Claude。我预计本月结束前这一切都将改变。
欢迎来到新一期的AI通讯,本周我们甚至有了一个名字:Promt模式(Prompt Mode)。我是你的主持人本·帕特森(Ben Patterson)。每周在Promt模式(Prompt Mode),我都会为你带来对普通用户至关重要的AI趋势分析。
谷歌年度I/O大会(Google I/O)的舞台已经准备就绪,大会定于2025年5月19日拉开帷幕,所有迹象都指向Gemini将迎来一次重大飞跃。确实,感觉谷歌一直在为I/O主题演讲保留关于Gemini的火力,届时我们肯定会看到这家科技巨头一个接一个地公布重大Gemini公告。
谷歌可能公布的Gemini公告之一是“主动助手”(Proactive Assistant),一个根据你关联的谷歌服务(Google Services)(比如Gmail、Google日历(Google Calendar)和Google云端硬盘(Google Drive))、短信、联系人,甚至你屏幕上的内容,提供“在正确时间提供个性化建议”的功能。
不过,更好的可能是去年Gemini代理(Gemini Agent)传闻中的升级。据Business Insider报道,谷歌员工已经在测试这个代号为“雷米”(Remy)的更新,他们称其为“一个针对工作、学习和日常生活的全天候个人代理”,它“将Gemini应用提升为一个能代表你采取行动的真正个人助手”,并且可以“主动处理复杂任务”。
在这些发展之外,外界普遍预计谷歌将发布——或者至少是预告——其下一个主要Gemini模型,很可能就是Gemini 4。这个新模型无疑会专注于代理式AI,甚至有传言称它可能原生支持图像和视频生成。谷歌当前的图像和视频模型Nano Banana 2和Veo 3.1目前与主要的Gemini模型是分开的。
简而言之,谷歌的I/O大会可能代表着我们从年初以来一直看到的趋势的巅峰:AI助手跳出聊天框,主动在现实世界中帮助你。而如果谷歌真的发布了其全天候AI助手,我相信肯定也会随之推出一个价格不菲的新订阅计划。
本周更多AI动态
Anthropic已将Claude Pro和Max用户的Claude Code使用上限翻了一番,这全都归功于它与SpaceX达成的一项协议,以使用其巨人1号数据中心(Colossus 1)。这有点令人惊讶,毕竟不久之前,SpaceX老板埃隆·马斯克(Elon Musk)还在称Anthropic是“厌恶人类的”和“邪恶的”。
事实证明,Chrome会悄悄将一个4GB的本地AI模型下载到你的桌面上。谷歌表示,这个小型模型能够实现多种有用的功能,包括总结网页和警告你网络诈骗,所有这些都无需访问云端。不想要这个文件在你的硬盘上?删除它很容易。
我不喜欢AI聊天机器人回复中的表情符号,而ChatGPT——至少到目前为止——一直是问题最严重的之一。但有了GPT-5.5 Instant,表情符号的洪流应该会逐渐减少为涓涓细流。
OpenAI新的Codex AI宠物不仅可爱,而且出奇地有用,它能在你的AI编码代理等待你批准或完成任务时通知你。
专门的Claude AI代理现在有了一个“做梦”模式,这是一个定时任务,允许它们审查和清理最近存储的记忆,并搜索过去聊天会话中的“模式与洞察”。
本周提示语:“反目标”提示(Anti-Goal Prompt)
你可能在某个时候与AI有过类似的对话:“我不是说过了不要重写我的求职信吗?你搞什么鬼?”原因很简单:AI聊天机器人太急于让你满意了,以至于它们常常急于完成你的初始请求,却忽视了你附加的指令。
幸运的是,有一个补救办法:“反目标”提示(Anti-Goal Prompt)。这种结构化的提示使用了XML标签,以确保AI看到并理解你请求的每个部分,包括上下文、目标,以及最重要的“反目标”。试试看吧。



