中国科技巨头阿里巴巴集团于本周一发布Qwen3系列AI模型,该公司宣称该系列模型性能可媲美谷歌OpenAI当下最先进的模型,部分场景甚至更胜一筹。该系列包含从6亿到2350亿参数规模的八款模型(参数规模大致反映模型的解题能力,通常参数越多表现越优),其中多数模型已或即将通过Hugging FaceGitHub平台以“开源”许可形式开放下载。

Cover Image

Qwen等中国本土模型系列的崛起,正迫使OpenAI等美国实验室加速提升AI技术能力,同时也促使政策制定者出台限制措施,意图制约中国AI企业获取训练模型所需的高端芯片。阿里巴巴表示,Qwen3采用“混合推理”架构——既能对复杂问题展开深度“思考推理”,也能快速响应简单请求。这种自检机制类似OpenAI的o3模型,但会带来更高延迟。“我们实现了思考与非思考模式的无缝切换,用户可自主调配计算资源。”Qwen团队在技术博客中介绍,“这种设计让任务预算配置更为灵活。”

部分Qwen3模型采用混合专家(MoE)架构,通过将任务分解交由专业化子模型处理,显著提升计算效率。据披露,该系列支持119种语言,训练数据涵盖超过36万亿token,数据源包括教科书、问答对、代码片段及AI生成内容等。相比前代Qwen2,Qwen3在多项能力上取得突破性进展。

在编程竞赛平台Codeforces的测试中,旗舰模型Qwen-3-235B-A22B以微弱优势超越OpenAI的o3-mini谷歌Gemini 2.5 Pro。该模型在美国数学竞赛AIME最新题库和思维推理测试BFCL中也表现突出,不过该版本目前尚未公开。面向公众开放的Qwen3-32B模型同样表现抢眼,在LiveCodeBench等编程测试中胜过OpenAI o1模型,与中国AI实验室深度求索(DeepSeek)的R1模型不相上下。

阿里巴巴特别强调,Qwen3工具调用指令遵循及数据格式复制方面优势显著。除开源模型外,用户还可通过Fireworks AIHyperbolic等云平台调用该服务。AI云服务商Baseten联合创始人兼CEO图欣·斯里瓦斯塔瓦指出,Qwen3再次印证了开源模型正逐步比肩闭源系统的行业趋势。“美国正在加紧限制对华芯片销售和中国技术采购,但像Qwen3这样尖端且开源的模型必将获得广泛应用。”他表示,“这反映出企业既在自主研发工具,同时也通过AnthropicOpenAI等闭源模型公司采购现成解决方案的现实。”


文章标签: #人工智能 #阿里巴巴 #开源模型 #AI竞赛 #大模型

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。