Claude代码泄露，AI正扫描用户脏话，隐私引担忧

PCWorld报道称，Claude Code的一次代码泄露事件揭示，Anthropic的人工智能正通过正则表达式检测，主动扫描用户消息中的脏话和沮丧情绪指标。泄露的“userPromptKeywords.ts”文件显示，Claude Code会监控负面短语，尽管这种数据收集的目的尚不明确。这一发现引发了更广泛的隐私担忧，人们担心其他人工智能平台（如ChatGPT和Gemini）可能也存在类似的监控行为。

Cover Image

我们都曾咒骂过表现不佳的人工智能助手，但事实证明，最受欢迎的Claude工具之一正在主动检查我们的消息，寻找特定的沮丧迹象——包括脏话。

这一发现源于一次大规模的Claude Code代码泄露事件，该事件暴露了Anthropic对其即将推出的工具和模型的许多计划，其中包含众多令人震惊的细节。Anthropic于本周二意外发布到公共软件注册表中的超过50万行代码，包含了各种引人注目的细节，例如新Claude模型的规格、允许Claude对公共代码库进行“隐秘”贡献的“卧底模式”、Claude Code的“常开”代理，甚至还有一个类似电子宠物的“伙伴”。

但泄露代码中发现的更奇怪的一点是，Claude Code正在主动监视我们的聊天消息，寻找那些作为用户沮丧迹象的词语和短语——包括脏话和其他诅咒语。

具体来说，Claude Code包含一个名为“userPromptKeywords.ts”的文件，其中有一个名为正则表达式的简单模式匹配工具，它会扫描提交给Claude的每一条消息，寻找特定的文本匹配。在这个特定案例中，正则表达式模式正在监视“wtf”、“wth”、“omfg”、“dumbass”、“horrible”、“awful”、“piece of —-”、“f— you”、“screw this”、“this sucks”以及其他一些生动的比喻。

需要明确的是，这个“脏话”搜索功能是通过Anthropic的泄露代码在Claude Code中发现的。Claude的桌面和网络应用代码并未包含在此次泄露中，因此我们不知道这些Claude界面背后发生了什么。

同样值得注意的是，这里使用的正则表达式功能并不复杂。事实上，正则表达式受到多种编程语言（从Java到Python）的支持，并且已经使用了几十年，其功能与普通的Ctrl-F查找相差无几。

虽然Claude Code泄露事件揭示了“沮丧词语”正则表达式的存在，但它并未说明Claude Code为何要在消息中搜索这些词语，或者它用这些信息做什么。

当然，我们可以猜测。一个可能的原因是，Anthropic正在收集遥测数据，以帮助其评估特定Claude模型和工具的表现。检测到的“沮丧”词语增加，将是发现新Claude功能不受欢迎的简单方法。

另一种可能性是，检测到的沮丧信号激增可能会触发Claude本身的行为改变，或许会使其更具同理心或更倾向于道歉。当然，咒骂Claude或任何其他人工智能通常会使聊天走向不同的方向（就像它对谷歌搜索结果的影响一样），但像Claude Code中那样的特定正则表达式检查，可能有助于使行为转变更加可靠。

虽然“沮丧词语”正则表达式目前仅在Claude Code中得到确认，但这不禁让人怀疑它是否也存在于Claude的桌面和网络应用中——或者ChatGPT、Gemini和其他大型人工智能参与者的代码库中是否也隐藏着类似的功能。

搜索结果如下

阅读全文

Claude代码泄露，AI正扫描用户脏话，隐私引担忧

也可以看看

《堕落之王》领衔四月会免，续作今夏来袭

阅读全文

PS6掌机性能超越Xbox Series S，PSSR3画质优于DLSS4.5

阅读全文

Netflix畅销书改编犯罪惊悚剧《好女孩的谋杀指南》，下月携新案正式回归

阅读全文