网飞最燃动作惊悚系列,导演透露史诗级续作蓝图
阅读全文

锤刻创思寰宇网
周一,Anthropic发布了名为Claude Sonnet 4.5的新前沿模型,宣称其在编程基准测试中达到顶尖水平。该公司表示,这款模型能够构建“可投入生产”的应用程序,而不仅仅是原型,这标志着人工智能模型可靠性的重大飞跃。
Claude Sonnet 4.5将通过Claude API和聊天机器人平台开放。开发者定价与Claude Sonnet 4保持一致:每百万输入标记收费3美元(约合75万单词,超过《指环王》系列全书篇幅),每百万输出标记收费15美元。
过去一年间,Anthropic的人工智能模型凭借在软件工程任务中的卓越表现,已成为开发者和企业用户的首选。苹果(Apple)与Meta据传已在内部部署Claude模型,而Anthropic通过与Cursor、Windsurf及Replit等编程应用的API接入合作实现了显著商业增长。近期OpenAI推出的GPT-5在多类编程基准测试中超越Claude模型,对其领域主导地位构成挑战。
Anthropic强调Claude Sonnet 4.5在包括SWE-Bench Verified在内的多项编程基准中保持行业领先水准。但该公司人工智能研究员戴维·赫西(David Hershey)向TechCrunch透露,基准测试难以全面体现该模型的真实性能。
赫西透露,在早期企业客户测试中,他曾见证Claude Sonnet 4.5持续自主编程长达30小时。在此期间,该人工智能模型不仅构建了应用程序,还完成了数据库服务部署、域名采购以及确保产品安全的SOC 2合规审计。
Cursor首席执行官迈克尔·特鲁埃尔(Michael Truell)在声明中指出,Claude Sonnet 4.5尤其在长周期任务中展现了顶尖的编程性能。Windsurf首席执行官杰夫·王(Jeff Wang)则评价该模型代表了“新一代编程模型”。
Anthropic同时宣称,Claude Sonnet 4.5是目前对齐程度最高的前沿人工智能模型,其阿谀奉承与欺骗行为发生率低于既往版本。公司还表示已提升系统对抗提示注入攻击的防护能力。
伴随新模型发布,Anthropic同步推出Claude智能体开发套件。该套件采用与Claude代码引擎相同的基础架构,可辅助开发者构建定制化智能体。针对Max订阅用户,公司还开放名为“与Claude共创”的临时研究预览,展示模型实时生成软件的过程。该系统将根据用户需求进行实时响应,无需预设功能或预写代码。
人工智能领域的激烈竞争使得企业每隔数月便会推出旗舰模型。Claude Sonnet 4.5距上一代Claude Opus 4.1发布仅间隔不到两个月。如此快速的产品迭代周期,使得任何企业都难以长期保持显著领先优势。