OpenAI在ChatGPT中推出了一款名为ChatGPT智能体的全新通用人工智能代理工具。该公司表示,该工具能代表用户完成各类计算机任务,包括自动管理日程、生成可编辑的演示文稿幻灯片,以及运行代码。

Cover Image

这款整合了多项前沿能力的工具,融合了OpenAI此前研发的Operator智能体的网页操作技术,以及Deep Research智能体从数十个网站整合信息生成简明研究报告的功能。用户仅需用自然语言向ChatGPT发出指令,即可与智能体进行交互。

服务计划与激活方式

ChatGPT智能体将于本周四向ProPlusTeam订阅用户开放。用户只需在ChatGPT工具下拉菜单中选择“智能体模式”即可启用该功能。

技术突破与行业意义

此次发布标志着OpenAI将ChatGPT从问答系统转型为能执行实际任务的智能体产品的重大尝试。尽管硅谷企业如谷歌Perplexity近年推出过数十款类似产品,但早期版本在复杂任务处理上表现欠佳。

OpenAI宣称新版智能体能力显著提升,其核心模型在多个基准测试中创下纪录:

  • 在涵盖百余学科的综合性测试Humanity's Last Exam中取得41.6%的通过率(pass@1),达到前代产品o3o4-mini的两倍水平

  • 在超高难度数学基准FrontierMath中,借助代码执行终端等工具获得27.4%的得分,远超o4-mini6.3%的前最佳成绩

功能扩展与安全机制

该智能体支持连接GmailGitHub等应用,通过API访问终端功能。OpenAI举例说明其可完成“为四人份日式早餐采购食材”或“分析三个竞争对手并制作幻灯片”等复杂工作流。

出于安全考虑,OpenAI将该模型在生物化学武器领域标记为“高能力”级别,并采取多项防护措施:

  • 实时监控系统会对所有涉及生物学的指令进行双重审查

  • 禁用记忆功能以防止通过提示注入攻击窃取敏感数据

  • 建立生物威胁内容识别机制

发展前景

尽管目前业界智能体技术在实际应用中仍存在局限,OpenAI表示已开发出更具执行力的新型模型。该公司强调将持续评估重新启用记忆功能的可能性,同时保持对潜在风险的警惕。


文章标签: #人工智能 #ChatGPT #智能体 #OpenAI #自动化

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。