谷歌人工智能研究机构DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)周二晚间暗示,公司最新视频生成模型Veo 3可能应用于电子游戏领域。

Cover Image

针对X平台用户“求用Veo 3视频玩游戏的实现方式”的提问,哈萨比斯回应称“这必将成为革命性突破”。周三上午,谷歌AI StudioGemini API产品负责人洛根·基尔帕特里克(Logan Kilpatrick)用表情符号🤐加入讨论。

虽然两位高管的表态仅具暗示性质,谷歌发言人向TechCrunch表示目前尚无具体计划,但构建可交互世界模型完全在这家科技巨头的技术射程之内。

世界模型与视频生成的区别

世界模型通过模拟真实环境动态,使智能体能预判行为引发的环境变化;而视频生成模型仅合成逼真视频序列。谷歌正将其多模态基础模型Gemini 2.5 Pro升级为模拟人脑机制的世界模型。

去年12月,DeepMind发布能生成“无限”可玩场景的Genie 2模型。次月,谷歌组建新团队专攻现实世界模拟AI。该领域竞争者还包括AI先驱李飞飞(Fei-Fei Li)创立的World Labs,其系统可实现单图像生成3D游戏场景。

Veo 3的现状与潜力

尚处公测阶段的Veo 3已能生成带音效的视频内容,虽能模拟真实物理运动,但本质上仍属被动输出的生成模型。要实现游戏开发应用,需升级为具备交互预测能力的模拟器。

游戏生产的核心挑战在于实时、稳定且可控的模拟系统,未来谷歌可能采用VeoGenie结合的混合方案。该领域或将形成与微软ScenarioRunwayPikaOpenAISora视频模型的竞争格局。凭借雄厚资金与渠道优势,谷歌在世界模型领域的动向值得业界密切关注。


文章标签: #人工智能 #游戏开发 #世界模型 #谷歌 #DeepMind

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。