OpenAI周一宣布,将为其人工智能编程代理Codex推出新版GPT-5。该公司表示,这款名为GPT-5-Codex的新模型能以比前代模型更动态的方式分配“思考”时间,处理编程任务时可能耗时数秒至七小时不等,从而在自主编码基准测试中表现更优。

Cover Image

该模型现正通过终端、集成开发环境、GitHubChatGPTCodex产品,向所有ChatGPT Plus、Pro、Business、EduEnterprise用户开放。OpenAI表示未来计划向API客户提供该模型。

此次更新是OpenAI为增强CodexClaude CodeAnysphere公司的Cursor以及微软GitHub Copilot等AI编程产品竞争力的举措。由于用户需求激增,AI编程工具市场在过去一年变得愈发拥挤。Cursor在2025年初年化经常性收入突破5亿美元,而同类代码编辑器Windsurf曾引发混乱收购案,最终其团队被谷歌Cognition公司拆分。

OpenAI称,在衡量自主编码能力的SWE-bench Verified基准测试中,以及针对大型成熟代码库重构任务的性能测试中,GPT-5-Codex的表现均优于GPT-5

该公司还透露,他们对GPT-5-Codex进行了代码审查专项训练,并邀请资深软件工程师评估模型的审查意见。据悉工程师们发现该模型提交的错误评论更少,同时能提供更多“高价值建议”。

在产品简报会上,OpenAICodex产品负责人亚历山大·恩比里科斯(Alexander Embiricos)表示,性能提升主要归功于GPT-5-Codex的动态“思考能力”。用户可能熟悉ChatGPTGPT-5的路由器机制——它会根据任务复杂度将查询导向不同模型。恩比里科斯指出GPT-5-Codex采用类似原理,但底层没有路由器架构,能实时动态调整任务处理时长。

相比需要在初始阶段就确定算力与时间分配的路由器机制,这种动态调整更具优势。GPT-5-Codex可以在处理问题五分钟后,决定再投入一小时进行深度运算。恩比里科斯透露,该模型在某些情况下耗时甚至超过七小时


文章标签: #OpenAI #Codex #GPT5 #编程AI #代码审查

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。