埃隆·马斯克(Elon Musk)提议在xAIGrok 5与前OpenAI研究主管安德烈·卡帕西(Andrej Karpathy)之间举行一场公开编程对决,并将其比作1997年加里·卡斯帕罗夫与IBM“深蓝”的经典对决。卡帕西婉拒了这一挑战,表示更愿与Grok合作而非对抗。

Cover Image

此提议源自卡帕西近期在《德瓦克什播客》(Dwarkesh Podcast)的访谈片段。他在访谈中称通用人工智能可能仍需十年方能实现,并指出Grok 5的技术水平落后GPT-4数月。曾宣称Grok 510%(且持续上升)概率实现通用人工智能的马斯克视此为邀约,直接在X平台发文询问:“你愿意参加这场人工智能编程对决吗?”

卡帕西回应称自己在此类对决中的贡献“将趋近于零”,并强调当前更应将人工智能模型视为协作伙伴而非竞争对手。人机编程对决的构想并非空谈。DeepMind今年初宣布Gemini 2.5ICPC世界总决赛条件下解出12道难题中的10道,达到金牌水平。OpenAIDeepMind现已分别凭借GPT-4GPT-5在同一基准测试中实现12题全对的完美成绩。这些选题均来自大学算法竞赛,从正确率与运行效率双重维度进行评判,且需在严格资源与时间限制下完成。

今年早些时候,一名波兰程序员在AtCoder世界巡回总决赛10小时鏖战中击败OpenAI定制模型,引发这可能是人类在顶级赛事中最后胜利的猜测。该竞赛采用全透明严格监赛机制。

若马斯克希望Grok 5在此领域获得认可,就需接受同等标准的检验。“深蓝”的类比唯有在可量化对决中才成立——这意味着必须采用公开题库的限时竞赛、统一的工具与算力配置,且杜绝外部推理或人工辅助。最终结果需经独立评审并完整公示。

卡帕西的退赛决定折射出机器学习从业者评价体系的深层转变:越来越多人关注模型如何提升人类生产效率,而非组织正面交锋。但竞技编程仍提供着清晰明确的基准参照。迄今Grok尚未在此领域公布任何成绩。若xAI欲证明其技术实力,在ICPC级任务中进行正式测试无疑是最直接的途径。


文章标签: #马斯克 #卡帕西 #编程对决 #Grok5 #人工智能

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。