我清楚地记得,我们终将迎来那一天:只需对着手机说一句“嘿,ChatGPT,今晚8点在Outback Steakhouse订个两人桌”,ChatGPT就能轻松搞定。但那天,不是今天。

所有大型人工智能提供商都在忙着推出与各类日常服务的集成,从Spotify和DoorDash到AllTrails和订餐应用Resy,成效各有不同。Anthropic的Claude就是最新例证。
除了Resy,Claude的其他新“连接器”还包括一些生活导向型工具,如Audible、Booking.com、Instacart、Intuit TurboTax、Spotify和Taskrabbit。ChatGPT也有自己的应用集成列表,包括Expedia、DoorDash、Zillow和Canva,而Gemini的“扩展”列表则包括Google地图、YouTube音乐和Spotify。
所有这些集成功能,都允许ChatGPT、Claude和Gemini通过“函数调用”直接与这些服务整合,即结构化请求(如“获取天气”或“查询数据库”),使人工智能模型得以跳出聊天框,在现实世界中实际执行操作。
因此,当像ChatGPT或Claude这样的人工智能提供商宣布与Spotify或Resy的集成或“连接”时,就意味着这些公司已经合作,为相关应用开发了特定的函数调用。
例如,ChatGPT的Spotify函数调用就包括诸如“添加到资料库”“获取认证令牌”“获取曲目”“获取当前播放内容”和“从资料库中移除”等功能,同时会附上模型何时及如何使用该函数调用的指令,比如“仅在用户明确询问当前播放内容时,才调用此工具”。你可以通过浏览ChatGPT设置中的“应用”菜单下的特定集成,查看具体细节。
像这样基于函数调用的集成在ChatGPT、Claude和Gemini中很常见,因为它们相对安全、易于控制,只让人工智能接触那些由应用开发者明确定义的函数。但具体到特定服务,它们也可能显得笨拙、麻烦,甚至比你自己直接打开应用还要难用,Resy的情况就是如此。
我试着将Resy连接到我的Claude账户,只需进入“自定义”>“连接器”,添加Resy集成即可,然后愉快地与Claude商量起在我曼哈顿中城公寓附近哪里吃饭,三人桌,大约晚上6点半。Claude给出了一个相当不错的推荐,是第二大道的Smith餐厅,我去过,味道不错。
“好的,Claude,帮我订个位。”我问道。Smith餐厅在Resy上有登记,Claude回答,“让我查一下今晚三位的空位。”
紧接着,聊天框中出现了一大段JSON(基本上是计算机代码)文字,标题是“Claude想要使用来自Resy的display_resy_restaurant_availabilites_app函数”,下面还有大大的“始终允许”和“拒绝”按钮。Claude代码的常用用户对这些按钮应该很熟悉,它允许你在Claude执行命令前批准或阻止待处理的指令。原始的JSON代码本身并非错误,但从日常用户体验来看,这实在太过笨拙。
我点击了“始终允许”,然后看到了一个显示当天所有空闲时段的网格。
“能帮我订晚上7点15分的桌吗?”我问道。“我无法替您完成预订,”Claude回答,“您需要点击上方Resy小部件中晚上7点15分的时段,并在那里完成预订,通过您的Resy账户只需几秒钟即可。祝您今晚用餐愉快!”
我确实点击了晚上7点15分的按钮,然后弹出一个提示,告知我将离开Claude并跳转到Resy网站,在那里我必须再次点击晚上7点15分的按钮才能完成预订。这时,我不禁想问,我这么折腾到底是为了什么?我iPhone上的Resy应用快多了。
需要说明的是,我并不想特别指责Claude在Resy这类笨拙应用集成上的表现。那些既帮助也限制了Claude的Resy连接器的函数调用和限制,同样适用于其他人工智能集成。如果你让ChatGPT或Gemini预订晚餐,它们能帮你完成90%的工作,但当你完成剩下的10%时,你会怀疑为什么不直接用应用。
当然,真正的魔法在于让一个人工智能代理亲自出马,替你完成那顿晚餐的预订,为你完成所有的滚动和点击操作。你其实可以尝试通过ChatGPT的代理模式来体验这一点,该模式拥有自己的浏览器,可以访问网页并点击链接。
于是,我打开ChatGPT,激活代理模式,点击聊天框中的“+”按钮,选择“代理”,然后给出提示:“帮我订一下纽约市龟湾Rosa Mexicano餐厅的位子,三位,今晚,大约晚上6点半。”
一两秒钟后,聊天框中打开了一个浏览器窗口,我眼看着ChatGPT导航到OpenTable,然后开始点击和滚动。
诚然,ChatGPT(或者更准确地说,OpenAI的Codex应用)在调试复杂代码库方面可能是个天才,但它应对OpenTable这样相对基本网页界面的能力却可笑地笨拙,连一些基本操作都搞不定,比如派对人数下拉菜单。它自己汇报说:“我好像误选了‘2人’而不是‘3人’,我会再次打开下拉菜单,确保选择正确选项。”
再次强调,我并非故意针对ChatGPT,看着Gemini在网络上探索的过程也同样令人恼火。
总之,经过大约五分钟令人抓狂的缓慢点击后,ChatGPT的代理终于完成了,算是吧。
“您的餐桌目前已被保留,”ChatGPT说,“接下来,网站需要您的个人用餐信息才能完成预订。请接手输入这些信息,完成后告知我。”
唉,下次我还是自己用OpenTable吧。
所以,没错,我毫不怀疑,最终我们的个人人工智能助手将能无缝地为我们预订晚餐、购买杂货和安排行程。但就今天而言,绕过人工智能直接使用应用,要容易得多。



