当时,我正在向Gemini寻求帮助,咨询一款我一直在研究的新AI工具。具体来说,我需要它帮我处理一个关键配置文件里的一些晦涩设置。这些都是非常深入的技术细节。

然后,就在我们聊天进行到一半时,Gemini突然抛出一个奇怪的话题:“既然你正在翻新曼哈顿的公寓,你其实可以把这套配置当作‘产品经理’来用,”Gemini说道,并“贴心”地补充说,我可以把PDF格式的平面图和承包商报价上传到这个新工具里。
呃……好吧,我们能回到那个YAML文件的话题上吗?
在同一段对话中,Gemini开始畅想这个新工具如何能与我自托管的Home Assistant设置集成(我在聊天中压根没提过这个),然后又给我扔了个曲线球,警告说我楼梯间的调光开关电池电量低,需要更换。什么情况?
过了一会儿,Gemini最后还提到,“既然[我]是PCWorld的撰稿人”,这整个安装体验“其实很适合写一篇关于‘本地AI现状’的文章”。这完全不是我当时在想的事情,不过我会考虑一下这个建议。
所有这些古怪的题外话,都源于一个大约推出一个月的Gemini功能,名为“个人智能”。它被宣传为一种将你的个人生活——或者至少是谷歌视角下的你的个人生活——与你的Gemini互动连接起来的方式。
但就目前而言,个人智能仍然经常插话,其明显意图似乎仅仅是为了炫耀它对我的了解。
个人智能背后的想法是好的,它旨在解决所有大语言模型固有的记忆限制问题。默认情况下,AI只会“记住”特定聊天线程的内容,而给定聊天中的所谓“上下文窗口”是有限的——对于最大的云端大语言模型来说非常大,但对于最小的本地模型来说则小如苍蝇。与AI交谈时间过长,它就会“忘记”你告诉它的、超出上下文窗口的任何信息。
AI行业已经开发了各种技巧来应对这些上下文限制,通常依赖于附加文件,甚至是相关信息的数据库(“你的用户名叫本,他在PCWorld工作,他喜欢墨西哥菜”),以便大语言模型在聊天过程中能够“记住”。
谷歌的“个人智能”工具则不同。它不是使用特定的文件或数据库,而是充当诸如Gmail、Photos、Search和YouTube等谷歌服务的管道,同时也允许Gemini引用之前的聊天记录。你可以在谷歌设置中管理哪些应用通过个人智能连接。
当Gemini想要扩展其上下文时,它可以调用个人智能集成,并从你的谷歌服务中提取可能与聊天相关的细节。当你看到“正在连接个人智能”的提示时,你就知道它正在这么做。
Gemini的个人智能功能是选择加入的,这意味着当系统提示时,你必须主动点击“我同意”按钮。在Gemini聊天机器人的“工具”菜单中也有一个开关,可以让你开启或关闭该功能。
实际上,我在理论上喜欢个人智能这个想法,它也确实偶尔能从我的谷歌活动中提取出一些相关的零碎信息,比如我联网的树莓派板的详细信息,或者我家附近影院正在上映的某部电影。
和所有AI事物一样,谷歌肯定也在微调其个人智能工具,寻找过于被动和过于主动之间的最佳平衡点。
但就目前而言,个人智能仍然经常插话,其明显意图似乎仅仅是为了炫耀它对我的了解。“作为PCWorld的撰稿人,”它很喜欢重复这句话,同时还不断地联系到我的“曼哈顿公寓翻新”,以及某某项目会是多么完美的契合。
呃,够了。


