PCWorld报道称,Claude Code的一次代码泄露事件揭示,Anthropic的人工智能正通过正则表达式检测,主动扫描用户消息中的脏话和沮丧情绪指标。泄露的“userPromptKeywords.ts”文件显示,Claude Code会监控负面短语,尽管这种数据收集的目的尚不明确。这一发现引发了更广泛的隐私担忧,人们担心其他人工智能平台(如ChatGPT和Gemini)可能也存在类似的监控行为。

我们都曾咒骂过表现不佳的人工智能助手,但事实证明,最受欢迎的Claude工具之一正在主动检查我们的消息,寻找特定的沮丧迹象——包括脏话。
这一发现源于一次大规模的Claude Code代码泄露事件,该事件暴露了Anthropic对其即将推出的工具和模型的许多计划,其中包含众多令人震惊的细节。Anthropic于本周二意外发布到公共软件注册表中的超过50万行代码,包含了各种引人注目的细节,例如新Claude模型的规格、允许Claude对公共代码库进行“隐秘”贡献的“卧底模式”、Claude Code的“常开”代理,甚至还有一个类似电子宠物的“伙伴”。
但泄露代码中发现的更奇怪的一点是,Claude Code正在主动监视我们的聊天消息,寻找那些作为用户沮丧迹象的词语和短语——包括脏话和其他诅咒语。
具体来说,Claude Code包含一个名为“userPromptKeywords.ts”的文件,其中有一个名为正则表达式的简单模式匹配工具,它会扫描提交给Claude的每一条消息,寻找特定的文本匹配。在这个特定案例中,正则表达式模式正在监视“wtf”、“wth”、“omfg”、“dumbass”、“horrible”、“awful”、“piece of —-”、“f— you”、“screw this”、“this sucks”以及其他一些生动的比喻。
需要明确的是,这个“脏话”搜索功能是通过Anthropic的泄露代码在Claude Code中发现的。Claude的桌面和网络应用代码并未包含在此次泄露中,因此我们不知道这些Claude界面背后发生了什么。
同样值得注意的是,这里使用的正则表达式功能并不复杂。事实上,正则表达式受到多种编程语言(从Java到Python)的支持,并且已经使用了几十年,其功能与普通的Ctrl-F查找相差无几。
虽然Claude Code泄露事件揭示了“沮丧词语”正则表达式的存在,但它并未说明Claude Code为何要在消息中搜索这些词语,或者它用这些信息做什么。
当然,我们可以猜测。一个可能的原因是,Anthropic正在收集遥测数据,以帮助其评估特定Claude模型和工具的表现。检测到的“沮丧”词语增加,将是发现新Claude功能不受欢迎的简单方法。
另一种可能性是,检测到的沮丧信号激增可能会触发Claude本身的行为改变,或许会使其更具同理心或更倾向于道歉。当然,咒骂Claude或任何其他人工智能通常会使聊天走向不同的方向(就像它对谷歌搜索结果的影响一样),但像Claude Code中那样的特定正则表达式检查,可能有助于使行为转变更加可靠。
虽然“沮丧词语”正则表达式目前仅在Claude Code中得到确认,但这不禁让人怀疑它是否也存在于Claude的桌面和网络应用中——或者ChatGPT、Gemini和其他大型人工智能参与者的代码库中是否也隐藏着类似的功能。



