最近,OpenAI的代理工具Operator可能即将发布。根据ChatGPT代码库的更新,Operator有望作为早期研究预览版本,面向每月支付200美元的Pro订阅用户开放。虽然这些代码更改尚未公开,但一位名叫崔的用户在ChatGPT的客户端代码中发现了相关更新。与此同时,媒体也在OpenAI的网站上发现了对Operator的类似引用。
以下是三个值得关注的细节:
代码中多次出现了“operator.chatgpt.com”网址。目前,该网址会自动跳转到ChatGPT的主页面。
未来可能会出现一个弹窗提示,告知用户如果想体验Operator,需要升级到Pro订阅计划。弹窗会显示:“Operator目前仅向Pro用户开放,作为早期研究预览。”
在OpenAI列出的Plus和Pro订阅计划页面中,将新增“访问Operator研究预览”作为Pro计划的一项专属福利。
此前,彭博社曾报道OpenAI正在开发一款通用代理工具,能够在网页浏览器中为用户执行各种任务。虽然听起来有些抽象,但我们可以想象一下,日常在浏览器中通过多次点击完成的琐碎操作,比如在领英上关注某人、在Concur中添加费用、在Asana中分配任务,或者在Salesforce中更新客户状态,Operator都可以通过指令集完成这些多步骤任务。
最近,《信息报》报道称OpenAI可能会在本周推出Operator。从目前的代码更新来看,似乎一切已经准备就绪,只待正式发布。
与此同时,Anthropic公司已经推出了一款可以控制电脑的人工智能模型,通过“计算机使用”API和本地工具来控制鼠标和键盘。目前,这项功能还处于测试阶段,仅向开发者开放。
根据目前的信息,Operator似乎将仅在ChatGPT的网页端使用,不会与用户的本地电脑直接交互。OpenAI可能会在其服务器上运行一个网页浏览器,通过这种方式为用户提供任务执行服务。
尽管如此,这仍然表明OpenAI在与电脑交互方面的能力正在不断进步。Operator是OpenAI底层代理框架的一个特定实现版本。未来,OpenAI是否会透露更多关于Operator背后的技术细节,我们将持续关注。