OpenAI推出ChatGPT智能体，能自动执行电脑任务

OpenAI在ChatGPT中推出了一款名为ChatGPT智能体的全新通用人工智能代理工具。该公司表示，该工具能代表用户完成各类计算机任务，包括自动管理日程、生成可编辑的演示文稿幻灯片，以及运行代码。

Cover Image

这款整合了多项前沿能力的工具，融合了OpenAI此前研发的Operator智能体的网页操作技术，以及Deep Research智能体从数十个网站整合信息生成简明研究报告的功能。用户仅需用自然语言向ChatGPT发出指令，即可与智能体进行交互。

ChatGPT智能体将于本周四向Pro、Plus和Team订阅用户开放。用户只需在ChatGPT工具下拉菜单中选择“智能体模式”即可启用该功能。

此次发布标志着OpenAI将ChatGPT从问答系统转型为能执行实际任务的智能体产品的重大尝试。尽管硅谷企业如谷歌和Perplexity近年推出过数十款类似产品，但早期版本在复杂任务处理上表现欠佳。

OpenAI宣称新版智能体能力显著提升，其核心模型在多个基准测试中创下纪录：

在涵盖百余学科的综合性测试Humanity's Last Exam中取得41.6%的通过率（pass@1），达到前代产品o3和o4-mini的两倍水平
在超高难度数学基准FrontierMath中，借助代码执行终端等工具获得27.4%的得分，远超o4-mini6.3%的前最佳成绩

该智能体支持连接Gmail和GitHub等应用，通过API访问终端功能。OpenAI举例说明其可完成“为四人份日式早餐采购食材”或“分析三个竞争对手并制作幻灯片”等复杂工作流。

出于安全考虑，OpenAI将该模型在生物化学武器领域标记为“高能力”级别，并采取多项防护措施：

尽管目前业界智能体技术在实际应用中仍存在局限，OpenAI表示已开发出更具执行力的新型模型。该公司强调将持续评估重新启用记忆功能的可能性，同时保持对潜在风险的警惕。

搜索结果如下