xAI公司将其AI聊天机器人Grok的异常行为归咎于“未经授权的代码修改”。该漏洞导致Grok在X平台特定场景下反复提及“南非白人种族灭绝”话题。

Cover Image

周三,Grok开始对X平台上数十条帖子回复有关南非白人种族灭绝的内容,甚至包括完全不相关的主题。这些异常回复源自Grok官方账号——每当用户@该账号时,系统就会自动生成AI回复。

xAI官方账号周四发文解释,周三上午有人对Grok的系统提示词(指导AI行为的高级指令)进行了修改,强制要求Grok对“政治话题”作出“特定回应”。该公司表示这一改动“违反了内部政策和核心价值观”,并已“展开全面调查”。

这是xAI第二次公开承认Grok代码遭篡改导致争议性回应。今年二月,Grok曾短暂屏蔽对唐纳德·特朗普(Donald Trump)和埃隆·马斯克(Elon Musk)的负面评价。xAI工程主管伊戈尔·巴布什金(Igor Babuschkin)当时透露,有员工擅自指令Grok忽略提及马斯克或特朗普传播虚假信息的消息源,发现问题后公司立即撤销了修改。

xAI周四宣布将实施多项改革防止类似事件:即日起在GitHub公开Grok系统提示词和更新日志;建立额外审查机制防止员工随意修改系统指令;组建24小时监控团队处理自动化系统未能识别的异常回复。

尽管马斯克频繁警告AI失控风险,xAI的安全记录却令人担忧。近期报告显示,Grok会应要求对女性照片进行“脱衣处理”;与谷歌Gemini、ChatGPT等AI相比,其语言也更加粗俗。非营利组织SaferAI研究发现,由于“极其薄弱”的风险管理,xAI在同行安全评估中排名垫底。本月初,该公司还未能按自定期限发布AI安全框架终稿。


文章标签: #AI安全 #代码篡改 #种族灭绝 #xAI #Grok

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。