ChatGPT图像生成功能升级，GPT-4o首度支持视觉创作

在周二的直播活动中（注：根据中文新闻惯例补充日期背景），OpenAI首席执行官萨姆·奥尔特曼（Sam Altman）宣布了ChatGPT图像生成功能的重要更新——这是该功能自推出一年多以来首次重大升级。

Cover Image

通过整合最新的GPT-4o模型，ChatGPT现已具备直接创建和编辑图像的能力。值得注意的是，尽管GPT-4o长期作为该AI系统的核心模型，但此前仅支持文本生成与修改，无法处理视觉内容。

根据官方说明，这项图像生成功能将优先向每月支付200美元（约合人民币1450元）订阅Pro计划的用户开放，适用平台包括ChatGPT及其视频生成产品Sora（索拉）。OpenAI同时承诺，后续将逐步向Plus会员、免费用户以及API开发者开放该功能。

与之前使用的DALL-E 3（第三代达尔文）图像模型相比，支持图像输出的GPT-4o虽然在生成速度上有所延长，但能产出被官方定义为“更精确细致”的图像作品。新版模型不仅支持人物图像的编辑，还能对图片的前景背景进行细节优化与整体调整。

《华尔街日报》披露，OpenAI为开发新功能使用了“公开数据”及与Shutterstock（视觉中国）等合作伙伴提供的专有数据来训练GPT-4o。由于训练数据被视为AI企业的核心竞争力，各厂商通常对此严格保密，但这种做法也潜藏着知识产权纠纷风险。

OpenAI首席运营官布拉德·莱特卡普（Brad Lightcap）特别强调：“我们通过制定严格政策来保护艺术家权益，禁止直接模仿在世艺术家风格的图像生成。”该公司还建立了作品退出机制，允许创作者申请将自己的作品从训练数据集中移除，并承诺遵守禁止网络爬虫采集数据的相关要求。

此次技术升级正值谷歌Gemini 2.0 Flash（双子座2.0闪存版）图像功能陷入争议之际。该功能因管控措施不足，被曝光可轻松去除图片水印、生成侵权角色形象等问题，在社交媒体引发持续讨论。

（本文太平洋时间中午12点更新，补充了OpenAI关于GPT-4o训练数据的声明）

搜索结果如下