法国人工智能实验室Mistral正式进军推理型AI模型领域。周二上午,Mistral发布了其首个推理模型系列Magistral。与OpenAI的o3、谷歌的Gemini 2.5 Pro等推理模型类似,Magistral通过逐步解决问题的方式,在数学、物理等学科领域实现了更高的一致性和可靠性。

Cover Image

该系列包含两个版本:Magistral SmallMagistral Medium。其中24亿参数规模的Magistral Small已通过宽松的Apache 2.0许可协议在Hugging Face平台开放下载(参数指引导模型行为的内部组件)。更强大的Magistral Medium目前已在Mistral旗下Le Chat聊天机器人平台、公司API及第三方合作云服务开启预览。

Mistral在官方博客中表示:“Magistral适用于从结构化计算、程序逻辑到决策树和规则系统等广泛的企业应用场景。这些模型针对多步骤逻辑进行了专门优化,不仅能提升可解释性,还能以用户语言呈现可追溯的思考过程。”

成立于2023年的Mistral是前沿AI模型实验室,已开发包括Le Chat聊天机器人和移动应用在内的一系列AI服务。该实验室获得General Catalyst等风投机构支持,迄今融资总额超91.41亿元人民币(11亿欧元)

尽管资源雄厚,Mistral在推理模型开发等领域仍落后于其他领先AI实验室。从其官方基准测试来看,Magistral的竞争力似乎并不突出。在评估物理、数学及科学能力的GPQA Diamond和AIME测试中,Magistral Medium表现逊于Gemini 2.5 Pro和Anthropic的Claude Opus 4。在流行编程基准测试LiveCodeBench上,Magistral Medium同样未能超越Gemini 2.5 Pro。

这或许解释了为何Mistral在博客中着重强调Magistral的其他优势。该公司声称,Magistral在Le Chat平台上的响应速度可达竞品的“十倍”,并支持意大利语、阿拉伯语、俄语和简体中文等多国语言。

“基于旗舰模型打造的Magistral专为科研、战略规划、运营优化和数据驱动决策而设计,”公司声明中写道,“无论是执行多因素风险评估建模,还是在约束条件下计算最佳交付时间窗口都能胜任。”

在发布Magistral之前,Mistral曾推出“氛围编程”客户端Mistral Code。更早几周,该公司还发布了多款编程专用模型,并推出企业级聊天机器人服务Le Chat Enterprise——该服务整合了AI智能体构建器等工具,并将Mistral模型与Gmail、SharePoint等第三方服务相集成。


文章标签: #人工智能 #推理模型 #Mistral #企业应用 #多语言

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。