昨天,微软Xbox正式推出了Muse,这是一款专为游戏构思设计的生成式人工智能模型。与此同时,微软还发布了一篇开放获取的Nature.com文章,并在博客上发布了一篇相关文章,同时配有一段YouTube视频。可能很多人对“游戏构思”这个概念感到困惑。微软将其定义为生成“游戏视觉效果、控制器操作或两者”,但其实际功能相当有限,甚至无法跳过传统游戏开发流程。
不过,一些技术细节仍然值得关注。Muse的训练是基于H100 GPU大规模完成的,大约需要100万次训练更新,才能将一秒钟的真实游戏画面扩展为额外9秒的响应式、引擎精准的模拟游戏画面。而训练数据主要来源于现有的多人游戏会话。
微软并没有在单台PC上运行这个模型,而是使用了一个由100个英伟达H100 GPU组成的集群进行训练。这不仅成本高昂,而且耗电量巨大,最终仅能生成300×180像素的输出分辨率,用于额外9秒的游戏画面外推。
团队通过Muse展示的最有趣之处在于,它能够在游戏环境中复制现有的道具和敌人,并让Muse复制它们的功能。然而,为了实现这些功能,微软投入了大量的硬件成本、电力消耗以及AI训练资源,而这些资源本可以用于直接使用开发工具生成敌人或道具。
尽管Muse最终能够保持物体恒常性并复制原始游戏的行为,但其最终的应用场景与已经成熟的传统游戏开发流程相比,似乎显得有些浪费。Muse未来的发展或许能够实现更多有趣的突破,但目前它仍然属于众多试图通过AI完全模拟游戏玩法的项目之一。尽管这里仍然保留了一定程度的引擎精度和物体恒常性,但这种开发、测试或玩游戏的方式实在低效得令人费解。即使花费大量时间研究相关资料,也很难理解为什么有人会想要使用它。