Robinhood首席执行官弗拉德·特涅夫(Vlad Tenev)联合创立的AI初创公司Harmonic本周一宣布,其聊天机器人应用Aristotle开启iOS和Android平台测试版发布。这款应用能让用户体验其号称具备“零幻觉”数学推理能力的AI模型——在当前AI模型可靠性普遍存疑的背景下,这一宣言显得尤为大胆。该公司专注于开发“数学超级智能”(MSI),未来计划将应用场景拓展至物理、统计、计算机科学等所有依赖数学的领域。

Cover Image

Aristotle是首款能进行推理并形式化验证输出结果的消费级产品,”Harmonic首席执行官兼联合创始人图多尔·阿基姆(Tudor Achim)在接受TechCrunch采访时表示,“在它支持的定量推理领域,我们确实能保证零幻觉。”该公司还透露,未来计划面向企业开放API接口,并为普通用户推出网页应用。

据称,Aristotle通过形式化测试(即将题目转化为机器可读格式)在2025年国际数学奥林匹克竞赛(IMO)中达到金牌表现水平。虽然谷歌OpenAI的AI模型今年也在IMO自然语言非正式测试中获得金牌,但Harmonic表示暂不公开其他基准测试数据。

此次测试版发布距该公司完成1亿美元B轮融资仅数周,本轮由Kleiner Perkins领投,估值达8.75亿美元。阿基姆称,公司正“沿着MSI目标高速前进”,投资方认为该估值与其宏图相匹配。

目前多家科技巨头正致力于开发数学解题AI。数学能力不仅是独立价值领域,更被视为验证核心推理能力的黄金标准——具备该能力的系统有望拓展至其他应用场景。阿基姆解释称,Aristotle通过开源编程语言Lean生成答复,并在反馈用户前采用非AI算法流程双重验证答案准确性,该技术已应用于医疗器械、航空等高危领域的输出验证。

即便在狭窄领域实现AI零幻觉仍是巨大挑战。研究表明,即便顶尖AI模型仍存在大量幻觉现象,且问题未见改善——OpenAI最新推理模型的幻觉率甚至高于旧版本。


文章标签: #AI #数学 #聊天机器人 #融资 #验证

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。