ChatGPT惨败48岁雅达利象棋，表现差到被小学生社团除名

一位工程师在摆弄ChatGPT时发现，这个号称全球领先的大语言模型对象棋对弈表现出令人啼笑皆非的自信。事实上，正是ChatGPT主动要求思杰公司工程师罗伯特·卡鲁索（Robert Caruso）安排它与基础象棋程序对决，宣称要展示“速胜”实力——结果却被雅达利2600主机内置的象棋游戏打得落花流水。

Cover Image

需要明确的是：现代象棋引擎早已超越人类棋手，像Stockfish这样的现成程序能轻松击败世界冠军。DeepMind等公司也开发了基于人工智能的象棋引擎。而作为最新大语言模型的ChatGPT 4o虽然在自然语言处理领域领先，但本质上并非专门的象棋引擎。

即便如此，人们仍期待它能展现出更强实力。卡鲁索在领英上透露：“当讨论人工智能在象棋领域的发展史时，ChatGPT主动提出要挑战雅达利象棋。它想证明自己能在多短时间内击败这个仅能预判1-2步、运行在1.19MHz处理器上的古董级程序。”

然而现实很骨感。“ChatGPT在初级难度下被彻底碾压，”卡鲁索描述道，“尽管获得了棋盘初始布局说明，它依然把城堡误认为主教，忽视兵形威胁，屡次丢失棋子位置——先是抱怨雅达利的抽象图标难以识别，改用标准棋谱记录后依然错误百出。其拙劣表现足以被小学三年级象棋社团除名。”

这款《视频象棋》作为早期游戏，其编程核心挑战在于仅用4KB内存（已是当时其他VCS游戏标准容量的两倍）实现基本功能。它只会机械计算当前最优着法，缺乏整体战略思维。换句话说，普通人类棋手应该能轻松取胜。但卡鲁索不得不花费90分钟“不断阻止ChatGPT走出昏招，每回合多次纠正它的棋盘认知。它总是保证‘重开一局就会进步’，最终连ChatGPT自己都低头认输。”

这场对决源于ChatGPT在讨论Stockfish和AlphaZero后主动请缨，自信能“轻松战胜”雅达利象棋。这个大语言模型显然“对速胜充满好奇”，还因得知卡鲁索棋艺不精而“承诺全程指导策略”。

故事并非全无亮点。卡鲁索指出当ChatGPT正确理解棋局时，确实能给出“可靠建议”，偶尔展现“惊人洞察”。但更多时候——这与常和ChatGPT互动者的体验一致——“它会提出荒谬建议……甚至试图移动已被吃掉的棋子，尽管当时它对棋盘其他部分的认知完全正确”。

当然，人工智能拥趸们会强调这并非大语言模型的专长。但此事引发了对该技术语境理解能力的深层思考。“它连基本棋盘状态都无法连贯记忆，实在令人失望，”卡鲁索质疑道，“这与对话中遗忘关键上下文有本质区别吗？”

借用雅达利昔日经典广告语，卡鲁索的结语耐人寻味：“今天你玩雅达利了吗？ChatGPT真希望自己没玩过。”