谷歌Gemini通关宝可梦蓝，AI里程碑获突破

谷歌最昂贵的AI模型似乎跨越了一个重要里程碑：击败了一款有着29年历史的电子游戏。昨夜，谷歌CEO桑达尔·皮查伊在X平台上兴奋发文：“多么精彩的收官！Gemini 2.5 Pro刚刚通关了《精灵宝可梦·蓝》！”

Cover Image

需要说明的是，这场“Gemini玩宝可梦”直播是由自称“与谷歌无关的30岁软件工程师”乔尔·Z（Joel Z）发起的。但谷歌高管们一直在为这项尝试加油助威。例如谷歌AI Studio产品负责人洛根·基尔帕特里克上月就发帖称，Gemini“在通关宝可梦方面取得重大进展”，并已“获得第五枚徽章（目前次优模型仅获得3枚，虽然使用了不同的智能体框架）”，引得皮查伊调侃道：“我们正在开发API——人工宝可梦智能:)”

为何选择《宝可梦》？今年二月，Anthropic公司曾重点介绍其Claude AI模型在《精灵宝可梦·红》中的进展，指出Claude的“扩展思维与智能体训练”使其在“更出人意料”的任务（如玩经典游戏）中表现突出。（《精灵宝可梦·红》与《蓝》是1996年发行的GameBoy游戏不同版本，同属经久不衰的宝可梦系列）。乔尔·Z坦言，正是受到“Claude玩宝可梦”Twitch频道的启发。

尽管取得进展，Claude似乎尚未通关《精灵宝可梦·红》。这是否意味着Gemini在游戏表现上更胜一筹？乔尔·Z在Twitch页面提醒观众：“请不要将此视为衡量大语言模型玩宝可梦能力的基准。二者无法直接比较——Gemini和Claude使用不同工具，接收不同信息。”

两款AI模型都需要辅助才能进行游戏——这正是前文提到的智能体框架的用武之地。该框架会向模型提供叠加额外信息的游戏截图，由模型决定如何响应（可能涉及调用专业智能体），最后按下与AI指令对应的按键。

乔尔·Z承认存在其他“开发者干预”帮助Gemini通关，但坚称这不构成作弊。“我的干预提升了Gemini的整体决策与推理能力，”他解释道，“我从不提供具体提示——比如月见山这样的特殊挑战没有任何攻略或直接指引。最接近干预的行为仅仅是告知Gemini需要与火箭队小兵对话两次才能获得电梯钥匙，这其实是后来在《精灵宝可梦·黄》中修复的漏洞。”他还补充道：“‘Gemini玩宝可梦’项目仍在积极开发中，框架持续进化。”

搜索结果如下

阅读全文

谷歌Gemini通关宝可梦蓝，AI里程碑获突破

也可以看看

塞巴斯蒂安·斯坦光头造型揭秘，为新片牺牲形象

阅读全文

纽约盗窃团伙主犯定罪，专偷夜店醉酒者

阅读全文

育碧九款刺客信条新作曝光，多款游戏开发中

阅读全文