酷睿Ultra 3 205评测,单核性能提升16%,集成显卡表现出色
阅读全文

锤刻创思寰宇网
OpenAI周一宣布,将为其人工智能编程代理Codex推出新版GPT-5。该公司表示,这款名为GPT-5-Codex的新模型能以比前代模型更动态的方式分配“思考”时间,处理编程任务时可能耗时数秒至七小时不等,从而在自主编码基准测试中表现更优。
该模型现正通过终端、集成开发环境、GitHub或ChatGPT等Codex产品,向所有ChatGPT Plus、Pro、Business、Edu和Enterprise用户开放。OpenAI表示未来计划向API客户提供该模型。
此次更新是OpenAI为增强Codex与Claude Code、Anysphere公司的Cursor以及微软的GitHub Copilot等AI编程产品竞争力的举措。由于用户需求激增,AI编程工具市场在过去一年变得愈发拥挤。Cursor在2025年初年化经常性收入突破5亿美元,而同类代码编辑器Windsurf曾引发混乱收购案,最终其团队被谷歌和Cognition公司拆分。
OpenAI称,在衡量自主编码能力的SWE-bench Verified基准测试中,以及针对大型成熟代码库重构任务的性能测试中,GPT-5-Codex的表现均优于GPT-5。
该公司还透露,他们对GPT-5-Codex进行了代码审查专项训练,并邀请资深软件工程师评估模型的审查意见。据悉工程师们发现该模型提交的错误评论更少,同时能提供更多“高价值建议”。
在产品简报会上,OpenAI的Codex产品负责人亚历山大·恩比里科斯(Alexander Embiricos)表示,性能提升主要归功于GPT-5-Codex的动态“思考能力”。用户可能熟悉ChatGPT中GPT-5的路由器机制——它会根据任务复杂度将查询导向不同模型。恩比里科斯指出GPT-5-Codex采用类似原理,但底层没有路由器架构,能实时动态调整任务处理时长。
相比需要在初始阶段就确定算力与时间分配的路由器机制,这种动态调整更具优势。GPT-5-Codex可以在处理问题五分钟后,决定再投入一小时进行深度运算。恩比里科斯透露,该模型在某些情况下耗时甚至超过七小时。