OpenAI在ChatGPT中推出了一项名为Lockdown Mode的新安全功能,旨在加强对所谓的“提示注入攻击(prompt injection attacks)”的防护。提示注入攻击是指攻击者精心设计欺骗性提示,试图诱使大语言模型(LLM)遵循恶意指令或泄露敏感信息。

这些欺骗性提示常隐藏于网页及其他数据源中,人类难以察觉,但大语言模型(LLM)在读取和处理时却会中招。提示注入攻击曾被用于多种恶意行为,例如劫持Perplexity的人工智能浏览器、通过Google Gemini控制智能家居设备,以及通过压缩图片和Google Calendar窃取个人信息。
该功能最早于今年2月公布。启用后,Lockdown Mode将限制或禁用ChatGPT的若干功能,包括实时网页浏览(转而使用缓存内容)、网页图片的检索与显示、Deep Research以及Agent Mode。
OpenAI强调,该功能无法完全消除提示注入攻击的风险,因为恶意指令仍可能存在于用户上传的文件或缓存内容中。
截至目前,Lockdown Mode正逐步向所有类型的ChatGPT账户推送,涵盖Free、Go、Plus和Pro套餐。若你暂时在设置中未看到该功能,说明尚未推送至你的账户,还需等待一段时间。



