华擎RX 9070 XT怪物猎人版上架Newegg,售价699美元
阅读全文

锤刻创思寰宇网
埃隆·马斯克(Elon Musk)提议在xAI的Grok 5与前OpenAI研究主管安德烈·卡帕西(Andrej Karpathy)之间举行一场公开编程对决,并将其比作1997年加里·卡斯帕罗夫与IBM“深蓝”的经典对决。卡帕西婉拒了这一挑战,表示更愿与Grok合作而非对抗。
此提议源自卡帕西近期在《德瓦克什播客》(Dwarkesh Podcast)的访谈片段。他在访谈中称通用人工智能可能仍需十年方能实现,并指出Grok 5的技术水平落后GPT-4数月。曾宣称Grok 5有10%(且持续上升)概率实现通用人工智能的马斯克视此为邀约,直接在X平台发文询问:“你愿意参加这场人工智能编程对决吗?”
卡帕西回应称自己在此类对决中的贡献“将趋近于零”,并强调当前更应将人工智能模型视为协作伙伴而非竞争对手。人机编程对决的构想并非空谈。DeepMind今年初宣布Gemini 2.5在ICPC世界总决赛条件下解出12道难题中的10道,达到金牌水平。OpenAI与DeepMind现已分别凭借GPT-4与GPT-5在同一基准测试中实现12题全对的完美成绩。这些选题均来自大学算法竞赛,从正确率与运行效率双重维度进行评判,且需在严格资源与时间限制下完成。
今年早些时候,一名波兰程序员在AtCoder世界巡回总决赛10小时鏖战中击败OpenAI定制模型,引发这可能是人类在顶级赛事中最后胜利的猜测。该竞赛采用全透明严格监赛机制。
若马斯克希望Grok 5在此领域获得认可,就需接受同等标准的检验。“深蓝”的类比唯有在可量化对决中才成立——这意味着必须采用公开题库的限时竞赛、统一的工具与算力配置,且杜绝外部推理或人工辅助。最终结果需经独立评审并完整公示。
卡帕西的退赛决定折射出机器学习从业者评价体系的深层转变:越来越多人关注模型如何提升人类生产效率,而非组织正面交锋。但竞技编程仍提供着清晰明确的基准参照。迄今Grok尚未在此领域公布任何成绩。若xAI欲证明其技术实力,在ICPC级任务中进行正式测试无疑是最直接的途径。