英伟达(NVIDIA)发布了其Nemotron 3系列的最新开源模型,该系列包含三种规格,并实现了更快的人工智能性能。英伟达今日宣布推出Nemotron 3系列开源模型、数据及库,旨在为跨行业的透明、高效、专业化智能体人工智能开发提供动力。

Cover Image

Nemotron 3模型——包含NanoSuperUltra三种规格——引入了突破性的混合潜在专家混合(MoE)架构,可帮助开发者大规模构建和部署可靠的多智能体系统。

英伟达Nemotron支持英伟达更广泛的“主权人工智能”计划,从欧洲到韩国的组织正在采用开放、透明、高效的模型,使他们能够构建符合自身数据、法规和价值观的人工智能系统。

包括埃森哲(Accenture)楷登电子(Cadence)CrowdStrikeCursor德勤(Deloitte)安永(EY)甲骨文云基础设施(Oracle Cloud Infrastructure)PalantirPerplexityServiceNow西门子(Siemens)Zoom在内的早期采用者,正在集成Nemotron系列的模型,为制造业、网络安全、软件开发、媒体、通信及其他行业的人工智能工作流提供动力。

开放的Nemotron 3模型使初创公司能够更快地构建和迭代人工智能智能体,并加速从原型到企业部署的创新进程。Mayfield投资组合下的公司正在探索使用Nemotron 3来构建支持人机协作的人工智能伙伴。

Nemotron 3凭借效率与准确性重塑多智能体人工智能。

Nemotron 3系列MoE模型包含三种规格:

Nemotron 3 Nano:一个小型300亿参数模型,其中30亿参数处于激活状态,适用于目标明确、高度高效的任务。

Nemotron 3 Super:一个高精度推理模型,拥有约1000亿参数和100亿激活参数,适用于多智能体应用。

Nemotron 3 Ultra:一个大型推理引擎,拥有约5000亿参数和500亿激活参数,适用于复杂的人工智能应用。

Nemotron 3 Nano现已推出,是计算成本效益最高的模型,针对软件调试、内容摘要、人工智能助手和低推理成本信息检索等目标任务进行了优化。该模型采用独特的混合MoE架构,在效率和可扩展性方面实现了提升。

Nemotron 2 Nano相比,此设计实现了高达4倍的令牌吞吐量,并将推理令牌生成减少了高达60%,显著降低了推理成本。Nemotron 3 Nano拥有100万令牌的上下文窗口,记忆能力更强,使其在冗长、多步骤任务中连接信息时更加准确、能力更强。

对人工智能进行基准测试的独立组织Artificial Analysis将该模型评为同尺寸模型中最为开放和高效的,并拥有领先的准确性。

Nemotron 3 Super擅长需要多个协作智能体以低延迟完成复杂任务的应用。Nemotron 3 Ultra则作为先进推理引擎,服务于需要深度研究和战略规划的人工智能工作流。

Nemotron 3 SuperUltra英伟达Blackwell架构上使用英伟达超高效的4位NVFP4训练格式,显著降低了内存需求并加快了训练速度。这种效率使得更大的模型可以在现有基础设施上进行训练,同时相对于更高精度的格式,其准确性不受影响。

借助Nemotron 3系列模型,开发者可以选择适合其特定工作负载规模的开源模型,智能体数量可以从数十个扩展到数百个,同时受益于更快、更准确的复杂工作流长程推理。

Nemotron 3 Nano现已通过Hugging Face以及包括BasetenDeepinfraFireworksFriendliAIOpenRouterTogether AI在内的推理服务提供商提供。

Nemotron已在企业人工智能和数据基础设施平台上提供,包括CouchbaseDataRobotH2O.aiJFrogLambdaUiPath。对于公共云客户,Nemotron 3 Nano将通过Amazon Bedrock(无服务器)亚马逊云科技(AWS)上提供,并即将在谷歌云(Google Cloud)CoreweaveNebiusNscaleYotta上获得支持。

Nemotron 3 Nano可作为英伟达NIM™微服务使用,用于在英伟达加速基础设施上的任何位置进行安全、可扩展的部署,以实现最大的隐私和控制。英伟达Nemotron 3 SuperUltra预计将于2026年上半年上市。


文章标签: #英伟达 #Nemotron3 #开源模型 #人工智能 #MoE架构

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。