在周二的直播活动中(注:根据中文新闻惯例补充日期背景),OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)宣布了ChatGPT图像生成功能的重要更新——这是该功能自推出一年多以来首次重大升级。

Cover Image

通过整合最新的GPT-4o模型,ChatGPT现已具备直接创建和编辑图像的能力。值得注意的是,尽管GPT-4o长期作为该AI系统的核心模型,但此前仅支持文本生成与修改,无法处理视觉内容。

根据官方说明,这项图像生成功能将优先向每月支付200美元(约合人民币1450元)订阅Pro计划的用户开放,适用平台包括ChatGPT及其视频生成产品Sora(索拉)。OpenAI同时承诺,后续将逐步向Plus会员、免费用户以及API开发者开放该功能。

与之前使用的DALL-E 3(第三代达尔文)图像模型相比,支持图像输出的GPT-4o虽然在生成速度上有所延长,但能产出被官方定义为“更精确细致”的图像作品。新版模型不仅支持人物图像的编辑,还能对图片的前景背景进行细节优化与整体调整。

《华尔街日报》披露,OpenAI为开发新功能使用了“公开数据”及与Shutterstock(视觉中国)等合作伙伴提供的专有数据来训练GPT-4o。由于训练数据被视为AI企业的核心竞争力,各厂商通常对此严格保密,但这种做法也潜藏着知识产权纠纷风险。

OpenAI首席运营官布拉德·莱特卡普(Brad Lightcap)特别强调:“我们通过制定严格政策来保护艺术家权益,禁止直接模仿在世艺术家风格的图像生成。”该公司还建立了作品退出机制,允许创作者申请将自己的作品从训练数据集中移除,并承诺遵守禁止网络爬虫采集数据的相关要求。

此次技术升级正值谷歌Gemini 2.0 Flash(双子座2.0闪存版)图像功能陷入争议之际。该功能因管控措施不足,被曝光可轻松去除图片水印、生成侵权角色形象等问题,在社交媒体引发持续讨论。

(本文太平洋时间中午12点更新,补充了OpenAI关于GPT-4o训练数据的声明)


文章标签: #AI #OpenAI #图像生成 #GPT4o #艺术版权

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。