英伟达近日正式推出开源模型系列Nemotron 3,包含Nano、Super和Ultra三种规格,旨在为AI智能体应用提供兼具高精度与高效能的解决方案。该系列通过引入创新的混合潜在专家(MoE)架构,支持开发者构建大规模、可靠的多智能体系统,应对复杂场景下的技术挑战。
随着企业从单一模型聊天机器人向协作式多智能体AI系统转型,开发者面临通信效率、上下文一致性及推理成本等多重难题。Nemotron 3系列通过优化架构设计,直接回应这些痛点,提供透明度与开放性,助力企业实现工作流程自动化。目前,安永、思科、Oracle Cloud Infrastructure、西门子等十余家行业领军企业已将其纳入AI开发流程,覆盖制造、网络安全、软件开发等领域。
该系列包含三款差异化模型:Nemotron 3 Nano为300亿参数的小型模型,每次激活参数不超过30亿,专为高针对性任务设计,如软件调试、内容摘要及低推理成本的信息检索;Super版本拥有约1000亿参数,每个token最多激活100亿参数,适用于多智能体协作场景;Ultra版本则扩展至5000亿参数,每token活跃参数达500亿,可支撑复杂AI应用需求。
Nemotron 3 Nano在计算成本效率方面表现突出,其性能较前代提升显著:token处理吞吐量提高4倍,推理token生成成本降低60%,同时配备100万token的上下文窗口,能更精准地处理长流程、多步骤任务。该模型已上线开源平台Hugging Face,开发者可自由调用;Super与Ultra版本预计于2026年上半年陆续发布。
对于初创企业而言,Nemotron 3的开源特性降低了AI智能体开发门槛,加速从原型设计到企业级部署的迭代周期。其模块化架构允许开发者根据需求灵活组合功能,在控制成本的同时实现定制化解决方案。




