尽管三星的相机部门目前可能缺乏有意义的创新,但它在人工智能领域的努力却截然不同,其最新发布的AI模型就生动体现了这一点——这款模型刚刚击败了某些体积大约是其1万倍的大型语言模型!

Cover Image

在题为《少即是多:微型网络的递归推理》的论文中,三星详细介绍了其新型微型递归模型的创新架构。该模型仅采用一个双层结构:

  • 微型递归模型规模极小,仅包含700万参数,而大型语言模型的参数往往达到数十亿量级。

  • 该模型能利用自身输出规划后续步骤,形成自我优化的反馈循环。

  • 通过迭代推理处理每个输出,模型可以模拟更复杂的架构,同时避免相应的内存或计算成本消耗。

  • 随着每次递归循环,模型能够逐步生成更精准的预测结果。

三星的这种方法类似于作者反复审阅草稿并逐次修正错误,其表现显著优于传统方案。传统大型语言模型在解决逻辑问题时,一旦单个步骤出错就可能导致整个推理链崩溃。虽然思维链技术有所助益,但其稳定性依然欠佳。

核心启示:化繁为简

三星尝试增加模型层数时发现,这种做法会因过拟合而降低泛化能力。相反,减少层数并增加递归次数,反而提升了微型递归模型的整体性能。

实测结果:

  • 数独极限难度测试中准确率达87.4%(层级推理模型仅为55%

  • 困难迷宫谜题中准确率为85%

  • ARC-AGI-1测试中达到45%准确率

  • ARC-AGI-2测试中取得8%准确率

关键突破在于,尽管三星微型递归模型的参数规模仅相当于各类大型语言模型的极微小部分,但其表现已超越或逼近包括DeepSeek R1谷歌Gemini 2.5 ProOpenAI o3-mini在内的多个先进模型。


文章标签: #人工智能 #递归模型 #参数优化 #逻辑推理 #模型创新

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。