OpenAIChatGPT中推出了一项名为Lockdown Mode的新安全功能,旨在加强对所谓的“提示注入攻击(prompt injection attacks)”的防护。提示注入攻击是指攻击者精心设计欺骗性提示,试图诱使大语言模型(LLM)遵循恶意指令或泄露敏感信息。

Message-ChatGPT-prompt-box.jpeg

这些欺骗性提示常隐藏于网页及其他数据源中,人类难以察觉,但大语言模型(LLM)在读取和处理时却会中招。提示注入攻击曾被用于多种恶意行为,例如劫持Perplexity的人工智能浏览器、通过Google Gemini控制智能家居设备,以及通过压缩图片和Google Calendar窃取个人信息。

该功能最早于今年2月公布。启用后,Lockdown Mode将限制或禁用ChatGPT的若干功能,包括实时网页浏览(转而使用缓存内容)、网页图片的检索与显示、Deep Research以及Agent Mode

OpenAI强调,该功能无法完全消除提示注入攻击的风险,因为恶意指令仍可能存在于用户上传的文件或缓存内容中。

截至目前,Lockdown Mode正逐步向所有类型的ChatGPT账户推送,涵盖FreeGoPlusPro套餐。若你暂时在设置中未看到该功能,说明尚未推送至你的账户,还需等待一段时间。


文章标签: #ChatGPT #安全 #AI攻击 #OpenAI #提示注入

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。