Anthropic公司发布了其最新的人工智能模型Claude Mythos。这个“通用、未发布的尖端模型”功能强大到令人印象深刻,以至于Anthropic对向广大公众发布它持谨慎态度。

Claude Mythos Preview“在发现和利用软件漏洞方面超越了除最熟练人类之外的所有人”,并且它有证据支持这一说法。就在过去几周内,它能够发现数千个先前未被发现的零日漏洞,包括:
一个存在于OpenBSD(世界上最安全的操作系统之一,用于关键基础设施)中长达27年的漏洞,该漏洞允许攻击者仅通过连接到任何OpenBSD机器就使其远程崩溃。
一个存在于FFmpeg(一个被数千个应用程序用于编码和解码视频的开源框架)中长达16年的漏洞。Linux内核中的几个漏洞,这些漏洞允许攻击者提升访问权限并完全控制机器。
Claude Mythos Preview自主地捕获了所有这些安全漏洞,证明了它对网络安全的未来可能具有多么宝贵的价值。这里的想法是,Anthropic希望Claude Mythos被用于善而非恶,以防御性地对抗随着生成式人工智能的普及而出现(并持续出现)的所有额外安全威胁。
我们目前不计划让Claude Mythos Preview普遍可用,但我们最终的目标是让我们的用户能够安全地大规模部署Mythos级别的模型。为了实现这一点,我们需要在开发网络安全(及其他)防护措施方面取得进展,以检测并阻止模型最危险的输出。
Claude Mythos是新的Project Glasswing(玻璃之翼项目)的一部分,这是一个涉及Anthropic的11家合作伙伴的重大安全倡议,这些合作伙伴包括:亚马逊网络服务(Amazon Web Services)、苹果(Apple)、博通(Broadcom)、思科(Cisco)、CrowdStrike、谷歌(Google)、摩根大通(JPMorganChase)、Linux基金会(the Linux Foundation)、微软(Microsoft)、英伟达(Nvidia)和Palo Alto Networks。



