OpenAI本周推出全新图像生成功能,该工具被官方称为“迄今最先进的图像生成器”,用户可通过搭载GPT-4o模型的ChatGPT使用该功能。值得注意的是,此前该平台长期依赖Dall-E系统进行图像生成。

Cover Image

据官方介绍,升级后的GPT-4o模型可实现高精度、高细节的拟真图像生成效果。该模型在文本渲染、精准执行用户指令以及对话语境理解方面表现尤为突出,同时支持基于上传图片进行二次创作,或将其作为视觉参考素材。

新模型还具备持续性创作能力,可在多张图像中保持主体形象一致性。其突破性进步体现在能够处理包含10至20个不同对象的复杂场景——目前主流AI图像生成工具普遍只能处理5到8个对象。

但OpenAI也坦承现有版本存在若干技术局限,具体表现在:画面裁切精度不足、元素增生问题、构图密度过高、图表生成误差、非拉丁文字显示异常、精细调整困难,以及小尺寸版面文字呈现模糊等情况。

目前这项升级后的图像生成功能已向ChatGPT免费版、Plus版、Pro版和团队版用户开放(企业版和教育版用户将逐步获得权限)。如果用户更青睐Dall-E的生成效果,仍可切换回旧版系统使用。


文章标签: #AI #图像生成 #GPT4o #OpenAI #新技术

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。