OpenAI正在升级其AI代理Operator(操作员)的底层模型。该代理能够自主浏览网页,并通过云端虚拟机运行特定软件来完成用户请求。很快,Operator将采用基于o3的新模型——这是OpenAI最新“推理”模型o系列中的成员,此前该服务一直依赖定制版GPT-4o。
根据多项基准测试,o3模型在数学和推理任务上展现出显著优势。OpenAI在官方博客中宣布:“我们将用基于o3的新版本取代现有GPT-4o版Operator,但API版本会继续沿用4o架构。”
Operator是近月来AI公司推出的众多智能代理工具之一。行业正竞相开发能够基本无需监督即可可靠完成复杂任务的智能体:谷歌通过Gemini(双子星)API提供具有网页浏览和代执行功能的“计算机使用”代理,以及面向消费者的Mariner(航海者)服务;Anthropic(人类)的模型同样具备打开文件、浏览网页等计算机操作能力。
新版Operator被命名为o3 Operator(o3操作员)。OpenAI表示该模型“通过额外的计算机使用安全数据进行了微调”,包括专门训练模型“掌握确认与拒绝决策边界”的数据集。技术报告显示,相比GPT-4o版本,o3 Operator在安全评估中表现更优:降低了对“非法”活动的拒绝率,减少敏感个人信息搜索倾向,同时对提示词注入攻击具有更强抵抗力。
OpenAI强调:“o3 Operator延续了4o版本的多层安全防护机制。虽然继承了o3的编程能力,但并未直接接入编程环境或终端。”该公司同期发布了详细的技术报告佐证这些改进。