谷歌最昂贵的AI模型似乎跨越了一个重要里程碑:击败了一款有着29年历史的电子游戏。昨夜,谷歌CEO桑达尔·皮查伊在X平台上兴奋发文:“多么精彩的收官!Gemini 2.5 Pro刚刚通关了《精灵宝可梦·蓝》!”

Cover Image

需要说明的是,这场“Gemini玩宝可梦”直播是由自称“与谷歌无关的30岁软件工程师”乔尔·Z(Joel Z)发起的。但谷歌高管们一直在为这项尝试加油助威。例如谷歌AI Studio产品负责人洛根·基尔帕特里克上月就发帖称,Gemini“在通关宝可梦方面取得重大进展”,并已“获得第五枚徽章(目前次优模型仅获得3枚,虽然使用了不同的智能体框架)”,引得皮查伊调侃道:“我们正在开发API——人工宝可梦智能:)”

为何选择《宝可梦》?今年二月,Anthropic公司曾重点介绍其Claude AI模型在《精灵宝可梦·红》中的进展,指出Claude的“扩展思维与智能体训练”使其在“更出人意料”的任务(如玩经典游戏)中表现突出。(《精灵宝可梦·红》与《蓝》是1996年发行的GameBoy游戏不同版本,同属经久不衰的宝可梦系列)。乔尔·Z坦言,正是受到“Claude玩宝可梦”Twitch频道的启发。

尽管取得进展,Claude似乎尚未通关《精灵宝可梦·红》。这是否意味着Gemini在游戏表现上更胜一筹?乔尔·Z在Twitch页面提醒观众:“请不要将此视为衡量大语言模型玩宝可梦能力的基准。二者无法直接比较——Gemini和Claude使用不同工具,接收不同信息。”

两款AI模型都需要辅助才能进行游戏——这正是前文提到的智能体框架的用武之地。该框架会向模型提供叠加额外信息的游戏截图,由模型决定如何响应(可能涉及调用专业智能体),最后按下与AI指令对应的按键。

乔尔·Z承认存在其他“开发者干预”帮助Gemini通关,但坚称这不构成作弊。“我的干预提升了Gemini的整体决策与推理能力,”他解释道,“我从不提供具体提示——比如月见山这样的特殊挑战没有任何攻略或直接指引。最接近干预的行为仅仅是告知Gemini需要与火箭队小兵对话两次才能获得电梯钥匙,这其实是后来在《精灵宝可梦·黄》中修复的漏洞。”他还补充道:“‘Gemini玩宝可梦’项目仍在积极开发中,框架持续进化。”


文章标签: #AI #谷歌 #宝可梦 #游戏 #里程碑

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。