OpenAI近日宣布将旗下聊天机器人ChatGPT最新升级的图像生成功能整合至应用程序接口(API),允许开发者将其集成到自有产品中。这款三月下旬向大部分用户开放的工具,曾因生成逼真的吉卜力风格图片和“AI手办”引发热议。该功能在为平台带来超过1.3亿用户首周内生成超7亿张图片的同时,也对服务器承载能力提出了严峻考验。

Cover Image

驱动该API的核心是名为“gpt-image-1”的多模态AI模型。该模型不仅能创作多种艺术风格图像,还能理解自定义指令、调用知识库并进行文字渲染。开发者可实现批量图像生成,并通过调节质量参数控制处理速度。

在安全机制方面,“gpt-image-1”沿用了ChatGPT原有的内容过滤系统,阻止生成违反政策的内容。开发者可选择两种审核模式:自动标准过滤或宽松低限制模式。相关文档显示,宽松模式会减少对年龄敏感内容的筛查类别。

所有生成图像均会添加C2PA元数据水印,便于平台识别其AI属性。定价方案显示,文本输入每百万标记收费36元(约5美元),图像输入72元(约10美元),图像输出288元(约40美元)。OpenAI估算不同质量方形图像的单张生成成本分别为0.15元、0.5元和1.4元。

目前包括Adobe(Adobe)、Figma(Figma)在内的多家企业已开始应用该技术。其中Figma设计平台支持用户直接调用模型进行图片编辑,Instacart则尝试将其应用于食谱与购物清单的可视化呈现。


文章标签: #AI生成 #多模态 #API #图像创作 #开发者

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。