AI初创公司黑森林实验室(Black Forest Labs),曾为X平台Grok聊天机器人提供图像生成技术,于周四发布了一套新型图像生成模型系列,其中部分模型兼具创作与编辑功能。
该公司在博文中介绍,新系列中性能最强的Flux.1 Kontext模型,既支持纯文本输入生成图像,也可结合参考图片进行创作。“Flux.1 Kontext系列实现了业界顶尖的图像生成效果,具有精准的指令跟随能力、照片级真实感渲染及出色的文字排版表现,其推理速度更比当前主流模型快达8倍。”
Flux.1 Kontext的发布正值图像生成器竞争白热化之际。谷歌本月初在I/O开发者大会上推出了最新图像生成模型Imagen 4,而今年早些时候,OpenAI为ChatGPT引入的升级版图像生成模型,曾因能生成吉卜力工作室(Studio Ghibli)风格的艺术作品引发网络热潮。
该系列包含两款型号:Flux.1 Kontex [pro]支持用户生成图像后通过多轮调整优化,同时保持画面角色与风格的一致性;Flux.1 Kontex [max]则侧重生成速度、画面连贯性及对提示词的精准还原。
与黑森林实验室早期模型不同,Flux.1 Kontex [pro]和[max]不提供离线下载版本。但该公司将推出“开放版”Kontext模型Flux.1 Kontext [dev],目前以封闭测试形式供研究及安全评估使用。同步上线的模型体验平台允许用户免注册第三方服务直接试用,新用户可获得200点信用额度,约可生成12张Flux.1 Kontex [pro]图像。
总部位于德国的黑森林实验室去年底传出正以10亿美元估值进行1亿美元融资谈判。其创始团队多来自知名图像生成模型Stable Diffusion的开发公司Stability AI,投资人包括安德森·霍洛维茨基金(Andreessen Horowitz)、Oculus联合创始人布伦丹·艾瑞比(Brendan Iribe)及Y Combinator掌门人盖瑞·谭(Garry Tan)。自结束隐匿模式以来,该公司已陆续发布多款图像生成模型及面向企业的API服务。