作为网络早期推出的AI图像生成服务之一,Midjourney在沉寂近一年后正式发布全新AI图像模型V7。这款被寄予厚望的模型于美国东部时间周四凌晨开启alpha测试,恰逢OpenAI在ChatGPT中推出新型图像生成器并因打造吉卜力(Ghibli)风格作品引发热议一周后。

Cover Image

需要说明的是,V7并非专为吉卜力风格优化的模型——至少官方未如此宣称——但从实际效果来看,该模型确实能创作出颇具美感的作品。用户需先对约200张图片进行评分以建立个性化档案(未创建者需完成此步骤),该档案可根据个人视觉偏好调整模型输出。值得注意的是,V7是Midjourney首款默认启用个性化功能的基础模型。

完成设置后,用户可在Midjourney官网或Discord聊天机器人(需加入官方服务器)中切换V7模式。网页端用户只需在“版本”标签旁的下拉菜单快速选择即可。公司CEO大卫·霍尔兹(David Holz)在X平台发文称V7采用了“完全不同的架构”,并在Discord公告中补充:“V7对文本提示的理解更智能,图像提示效果惊艳,画质显著提升且纹理精美,人物肢体、手部及各类物体的细节连贯性大幅增强。”

新模型提供Turbo(高成本)和Relax两种模式,并支持名为“草稿模式”的新功能——该模式以标准模式10倍的速度和半额成本生成图像,虽画质稍逊,但用户可一键进行增强重制。霍尔兹透露,包括图像超分辨率与材质替换在内的多项常规功能尚未适配V7,预计未来两个月内陆续上线。

“这款全新模型具备独特优势,可能也存在某些不足。”霍尔兹在Discord写道,“我们需要大家共同探索其优缺点,但请记住它可能需要不同的提示技巧,不妨多尝试不同玩法。”实测显示,V7对“带尖刺尾巴的龙”等提示响应精准,虽未进行深度测试,但“吉卜力风格角色”的生成效果已可圈可点。

这家特立独行的公司由Leap Motion联合创始人霍尔兹于2022年创立,至今未接受任何外部融资。据2023年底数据显示,Midjourney年营收预计达2亿美元(14亿元人民币)。这家总部位于旧金山的企业近期宣布组建硬件团队推进未公开项目,并持续开发此前公布的视频与3D物体生成模型。目前公司正面临多起诉讼,被指控未经创作者同意擅自抓取网络图像训练AI工具,涉嫌侵犯数百万艺术家的权益。


文章标签: #AI生成 #Midjourney #图像模型 #V7 #人工智能

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。