根据一篇最近的博客文章,OpenAI正在为ChatGPT推出两项新的安全功能,以应对其人工智能系统日益增长的威胁。

随着人工智能服务越来越多地连接到更广泛的网络部分和更多的外部应用程序,所谓的“提示注入攻击”风险也随之增加。提示注入攻击是指有人制作欺骗性的提示,试图诱使大型语言模型遵循恶意指令和/或泄露敏感信息。
其中一项新功能是“锁定模式”,这是一种面向有高隐私需求的用户的可选安全模式。此模式严格限制ChatGPT与外部系统的交互方式。某些工具和功能被完全禁用,网页浏览仅允许通过缓存内容进行,而非直接网络调用。锁定模式将首先面向企业客户提供,并在未来几个月内向消费者推出。
同时,将引入更清晰的风险标签,对于安全风险增加的功能(例如,赋予人工智能工具网络访问权限的功能),将使用统一的标签,上面带有“高风险”字样。这些标签将在ChatGPT、ChatGPT Atlas和Codex中可见。



