谷歌(Google)宣布将视频生成AI模型Veo 2开放给订阅高级版Gemini Advanced的用户使用,该服务是该公司推出的付费AI解决方案。此次功能更新正值谷歌与OpenAI的Sora视频生成平台展开激烈竞争之际。两周前,合成媒体领域头部企业Runway公司发布第四代视频生成器,并获得超过3亿美元(21亿元人民币)融资。
从本周二起,Gemini Advanced订阅用户可在谷歌Gemini应用的下拉菜单中选择Veo 2模型。该工具支持生成16:9画幅比例、720p分辨率且时长8秒的视频片段,用户可通过Gemini的“分享”按钮将作品直接上传至TikTok、YouTube等平台。生成视频支持下载为MP4格式文件,并带有谷歌SynthID技术的水印。
谷歌强调,现阶段对用户每月生成的视频数量设有限制,同时暂不向Google Workspace商业版和教育版用户开放权限。值得关注的是,Veo 2还与实验性功能Whisk完成整合——该功能隶属于Google Labs项目,允许用户以图片作为提示词生成新图像。新增的Whisk Animate功能可将静态图像转化为8秒时长的Veo 2动态视频。(Google Labs是谷歌发布早期AI产品的平台,需订阅每月140元人民币[20美元]的Google One AI Premium服务方可使用)
尽管当前Veo 2的应用场景相对基础,但谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)透露,公司计划将Gemini AI模型与Veo深度结合,以提升AI对物理世界的理解能力。
行业影响方面,视频生成工具正引发创意产业从业者的担忧。代表好莱坞动画师和漫画家利益的工会“动画协会”(The Animation Guild)2024年委托研究显示,预计到2026年全美将有超10万个影视动画岗位受到AI技术冲击。