台积电Q2AI收入破百亿,英伟达成关键推手
阅读全文

锤刻创思寰宇网
OpenAI在ChatGPT中推出了一款名为ChatGPT智能体的全新通用人工智能代理工具。该公司表示,该工具能代表用户完成各类计算机任务,包括自动管理日程、生成可编辑的演示文稿幻灯片,以及运行代码。
这款整合了多项前沿能力的工具,融合了OpenAI此前研发的Operator智能体的网页操作技术,以及Deep Research智能体从数十个网站整合信息生成简明研究报告的功能。用户仅需用自然语言向ChatGPT发出指令,即可与智能体进行交互。
ChatGPT智能体将于本周四向Pro、Plus和Team订阅用户开放。用户只需在ChatGPT工具下拉菜单中选择“智能体模式”即可启用该功能。
此次发布标志着OpenAI将ChatGPT从问答系统转型为能执行实际任务的智能体产品的重大尝试。尽管硅谷企业如谷歌和Perplexity近年推出过数十款类似产品,但早期版本在复杂任务处理上表现欠佳。
OpenAI宣称新版智能体能力显著提升,其核心模型在多个基准测试中创下纪录:
在涵盖百余学科的综合性测试Humanity's Last Exam中取得41.6%的通过率(pass@1),达到前代产品o3和o4-mini的两倍水平
在超高难度数学基准FrontierMath中,借助代码执行终端等工具获得27.4%的得分,远超o4-mini6.3%的前最佳成绩
该智能体支持连接Gmail和GitHub等应用,通过API访问终端功能。OpenAI举例说明其可完成“为四人份日式早餐采购食材”或“分析三个竞争对手并制作幻灯片”等复杂工作流。
出于安全考虑,OpenAI将该模型在生物化学武器领域标记为“高能力”级别,并采取多项防护措施:
实时监控系统会对所有涉及生物学的指令进行双重审查
禁用记忆功能以防止通过提示注入攻击窃取敏感数据
建立生物威胁内容识别机制
尽管目前业界智能体技术在实际应用中仍存在局限,OpenAI表示已开发出更具执行力的新型模型。该公司强调将持续评估重新启用记忆功能的可能性,同时保持对潜在风险的警惕。