PCWorld测试了ChatGPT全新的Images 2.0模型,该模型在AI生成的图像中展现出了令人惊叹的文本渲染精度,包括手写风格。

Cover Image

升级后的模型现已对所有用户开放,并引入了增强功能,如网络搜索、信息图创建以及包括非拉丁字母在内的多语言支持。

Images 2.0改进的文本渲染能力,为其在创建目录、故事板和详细技术文档等实际应用中,提供了完美的文本准确性。

长期以来,图像生成模型在渲染文本方面一直表现不佳。但虽然乱码的字母曾是人工智能的明显破绽,ChatGPT的新图像生成工具却是我见过的渲染文本效果最好的。

我让ChatGPT的Images 2.0模型(现已对所有ChatGPT用户开放,包括免费版用户)将我最近一篇文章中的文字,用铅笔渲染在黄色便签纸上。结果,在我看来,它做得几乎完美无缺。

OpenAI表示,Images 2.0是其首个具备“思考”能力的图像生成模型,这意味着它在开始处理图像提示前,可以停下来进行思考。

在文本方面,Images 2.0支持多种语言,包括日语、韩语、中文、印地语、孟加拉语以及其他使用非拉丁字母的语言。它还可以在渲染图像前搜索网络获取实时信息,并能一次性生成多张图像,非常适合渲染目录图片、漫画风格面板和故事板。

OpenAI承诺,Images 2.0将带来“前所未有的精确度和保真度”,这(有望)意味着它将在遵循提示方面做得更好——即,创建完全按照您指令执行的图像。

凭借这种精确度,Images 2.0或许能解答我长期以来对图像生成模型的疑问:除了创建恶搞表情包或令人毛骨悚然的深度伪造之外,它们还有什么用?真正的、实际的应用是什么?

近乎实时的排版、信息图创建和目录渲染可能是其中一些解决方案,尽管修正一个拼写错误需要完全重新渲染图像。

另外,您越是尝试使用Images 2.0(我只玩了大约一个小时),渲染出的图像可能就越显千篇一律。这就是为什么您可能需要一位技艺精湛、具备设计眼光的人类提示者来掌舵。


文章标签: #ChatGPT #图像模型 #文本渲染 #多语言 #AI应用

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。