Anthropic公司近日正式推出旗舰人工智能的最新版本——Claude Opus 4.5。据Techcrunch报道,该版本在多项基准测试中表现卓越,包括SWE-Bench(编程)、tau2-bench(工具使用)和GPQA Diamond(问题解决)等。这是首个在SWE-Bench Verified测试中获得超过80%分数的模型,该测试是衡量AI编程能力的重要基准。

新增功能包括面向Max、Team及Enterprise用户的Claude for Excel侧边栏,现支持数据透视表、图表及文件上传功能。同时,所有Max用户均可使用Claude for Chrome扩展。
另一项升级在于内存管理的优化。当对话达到内存上限时,模型会自动在后台压缩早期对话内容,确保用户与Claude的交流无需中断即可持续进行。
Opus 4.5还针对代理式应用场景进行专项优化,可作为主控代理协调由Haiku驱动的子代理协同工作。Anthropic强调,该版本是其迄今最安全的模型,具备更强的提示注入攻击防护能力。



