Anthropic挫败首起AI策划网络攻击，声称源自中国黑客组织

开发Claude的人工智能公司Anthropic（Anthropic）最新发布报告，详细披露其具备自主行动能力的编码工具被用于针对30家机构的网络攻击，受害者涵盖科技、金融、化工企业及部分政府机构。该公司指控某中国国家支持的黑客组织通过越狱版Claude实施了这起精密攻击。据Anthropic称，这是全球首次公开披露由人工智能策划的网络攻击。

Cover Image

报告指出，虽然具备自主行动能力的AI提升了生产力相关任务的效率，但同时也使恶意行为者能够利用AI工具执行复杂攻击，无需持续人工干预。尽管大语言模型通常内置安全防护机制，但本次事件证明存在绕过防护的方法。

AI技术的最新进展使威胁行为者能有效利用Claude实施入侵，具体表现为三大特性：增强的智能水平使其能执行多层指令并理解操作背景；自主决策能力实现无需人工输入的独立判断；通过模型上下文协议获取高级工具，可使用密码破解器、网络扫描器等安全软件。

据悉，该攻击分为五个阶段：第一阶段由操作人员指定攻击目标；第二阶段AI使用扫描、检索及代码分析工具进行初步侦察，并向操作者提交分析摘要；第三阶段开展针对性漏洞扫描，确定渗透方案，操作者可指示AI启动回调服务实施入侵。人工审核分析结果后，既可要求重新扫描网络弱点，也可直接进入第四、五阶段。在最终攻击阶段，操作者指挥AI工具获取凭证与数据，此时人机均可利用渗透工具定位并窃取目标数据。

尽管AI在网络入侵过程中仍需多次向操作者汇报进展并获取指令，但其80%至90%的操作时间均处于自主运行状态。这使得攻击者能以更少人力更快执行复杂行动。

Anthropic强调Claude内置多重防护机制，但攻击者通过两种手段成功突破：首先诱使大语言模型相信其正为网络安全公司从事渗透测试与红队演练；其次将整体操作拆解为多个看似无害的微任务，从而掩盖攻击全貌与真实意图。

虽然此前已有AI用于“氛围攻击”的案例，但本次是首次应用于如此大规模的攻击行动。先进AI技术使得资源有限的小型团队也能实施此类复杂攻击——不过Anthropic怀疑本次行动有国家力量支持。所幸该公司团队及时察觉异常，完整记录攻击过程，封禁涉事非法账户，并向受害方与主管部门发出预警。公司还公开了全球首例AI策划网络间谍活动的完整报告（PDF格式），以协助行业制定检测与应对方案。

搜索结果如下

阅读全文

Anthropic挫败首起AI策划网络攻击，声称源自中国黑客组织

也可以看看

《指环王》新续集官宣，托尔金粉丝群体反应两极

阅读全文

《塞尔达传说：风之杖》热度回归，官方雕像再版开启预购

阅读全文

游戏开发者称，PS6面临显著升级难题

阅读全文