Anthropic发布Claude Sonnet 4.5，编程能力顶尖的AI模型

周一，Anthropic发布了名为Claude Sonnet 4.5的新前沿模型，宣称其在编程基准测试中达到顶尖水平。该公司表示，这款模型能够构建“可投入生产”的应用程序，而不仅仅是原型，这标志着人工智能模型可靠性的重大飞跃。

Cover Image

Claude Sonnet 4.5将通过Claude API和聊天机器人平台开放。开发者定价与Claude Sonnet 4保持一致：每百万输入标记收费3美元（约合75万单词，超过《指环王》系列全书篇幅），每百万输出标记收费15美元。

过去一年间，Anthropic的人工智能模型凭借在软件工程任务中的卓越表现，已成为开发者和企业用户的首选。苹果（Apple）与Meta据传已在内部部署Claude模型，而Anthropic通过与Cursor、Windsurf及Replit等编程应用的API接入合作实现了显著商业增长。近期OpenAI推出的GPT-5在多类编程基准测试中超越Claude模型，对其领域主导地位构成挑战。

Anthropic强调Claude Sonnet 4.5在包括SWE-Bench Verified在内的多项编程基准中保持行业领先水准。但该公司人工智能研究员戴维·赫西（David Hershey）向TechCrunch透露，基准测试难以全面体现该模型的真实性能。

赫西透露，在早期企业客户测试中，他曾见证Claude Sonnet 4.5持续自主编程长达30小时。在此期间，该人工智能模型不仅构建了应用程序，还完成了数据库服务部署、域名采购以及确保产品安全的SOC 2合规审计。

Cursor首席执行官迈克尔·特鲁埃尔（Michael Truell）在声明中指出，Claude Sonnet 4.5尤其在长周期任务中展现了顶尖的编程性能。Windsurf首席执行官杰夫·王（Jeff Wang）则评价该模型代表了“新一代编程模型”。

Anthropic同时宣称，Claude Sonnet 4.5是目前对齐程度最高的前沿人工智能模型，其阿谀奉承与欺骗行为发生率低于既往版本。公司还表示已提升系统对抗提示注入攻击的防护能力。

伴随新模型发布，Anthropic同步推出Claude智能体开发套件。该套件采用与Claude代码引擎相同的基础架构，可辅助开发者构建定制化智能体。针对Max订阅用户，公司还开放名为“与Claude共创”的临时研究预览，展示模型实时生成软件的过程。该系统将根据用户需求进行实时响应，无需预设功能或预写代码。

人工智能领域的激烈竞争使得企业每隔数月便会推出旗舰模型。Claude Sonnet 4.5距上一代Claude Opus 4.1发布仅间隔不到两个月。如此快速的产品迭代周期，使得任何企业都难以长期保持显著领先优势。

搜索结果如下

阅读全文

Anthropic发布Claude Sonnet 4.5，编程能力顶尖的AI模型

也可以看看

Hulu浪漫剧《正常人》拯救BBC三台，成经典佳作

阅读全文

Xbox Game Pass会员限时福利，额外免费游戏仅剩24小时

阅读全文

AMD锐龙5 5500X3D登陆英国零售商，售价237美元

阅读全文