近日,OpenAIGoogle DeepMind分别宣布,其人工智能模型在2025年国际数学奥林匹克竞赛(IMO)中获得金牌成绩。这项拥有悠久历史的全球顶级中学生数学赛事,正成为科技巨头展示AI推理能力的竞技场。

Cover Image

比赛结果表明,人工智能系统正以惊人速度进步,而谷歌OpenAI在这场竞赛中展现出旗鼓相当的实力。科技公司们正在激烈争夺“AI领军者”的公众认知——这场关乎行业声望的无形较量,将直接影响顶级AI人才的归属。值得注意的是,许多AI研究者都有竞赛数学背景,这使得IMO成绩比其他基准测试更具象征意义。

与去年谷歌需依赖人工将题目转化为机器可读格式的“正式”系统(仅获银牌)不同,今年两家公司均采用能直接理解自然语言问题并生成证明过程的“非正式”系统。双方均宣称其AI模型在六道试题中正确解答五道,成绩超越绝大多数参赛中学生及谷歌去年的AI模型。

接受TechCrunch采访时,两家公司的研究人员表示,金牌成绩标志着AI在非可验证领域的推理能力取得突破。当前AI虽擅长解答答案明确的数学或编程问题,但在“挑选优质椅子”或“辅助复杂研究”等开放性问题中仍显不足。

然而,谷歌OpenAI的成绩公布方式提出质疑。在OpenAI上周六早间宣布成绩后,Google DeepMind首席执行官与研究团队通过社交媒体指责对方:一是在IMO周五晚间公布学生获奖名单后立即跟风宣布,二未通过IMO官方评估。Google DeepMind高级研究员、IMO项目负责人Thang Luong强调,公司为尊重参赛学生刻意延后至周一早间才公布经IMO主席认可及官方评分的成绩。

OpenAI高级研究员Noam Brown则透露,尽管数月前IMO曾邀请其参与正式数学竞赛,但公司选择专注于自然语言系统的研发。他表示OpenAI聘请了三位懂评分体系的前IMO奖牌得主作为第三方评估员,在确认金牌成绩后立即联系IMO,并遵从对方要求等待至颁奖典礼结束后才公布。

这场争议背后折射出更重要的趋势:多家领先AI实验室的模型正在快速进步。今年全球顶尖中学生选手中,仅有极少数能达到OpenAI谷歌AI模型的成绩水平。虽然OpenAI曾长期领跑行业,但当前竞争格局已比任何公司公开承认的更为胶着。随着GPT-5预计在未来数月发布,该公司亟需强化其行业领导者的公众形象。


文章标签: #人工智能 #数学竞赛 #谷歌 #OpenAI #行业竞争

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。