Nvidia 发布了迄今为止最好的开放人工智能模型，但仍落后于中国

周日，黄仁勋穿着皮夹克走上台北国际电脑展的舞台，并推出了 Nemotron 3 Ultra——Nvidia 有史以来最大的开放式人工智能模型，至少目前是美国制造的最智能的开放式重量模型。很好。只是还不足以击败中国。

该模型包含大约 5500 亿个总参数，但在任何给定时刻仅在 550 亿个活跃参数上运行，采用了一种称为“专家混合”的设计。参数决定了人工智能模型的知识广度，参数越多通常意味着功能越强大。

要了解专家混合模式的工作原理，请将其想象为一家拥有数百名专家的医院：当患者进来时，只有相关医生真正出现，而不是所有工作人员。这种方法使运行模型的成本远低于其标题参数计数所建议的成本，这正是 Nvidia 可以声称推理速度快 5 倍并且成本比同类开放权重替代方案低 30% 的原因。

独立评估机构Artificial Analysis与 Nvidia 合作进行预发布评估，将 Nemotron 3 Ultra 的智能指数评为 48 分。智能指数是一项综合基准，汇总了涵盖推理、编码、一般知识和代理性能的 10 项评估，得分按数字表示，越高意味着越聪明。

这使其成为美国顶级开放重量型号，遥遥领先。其次最接近的美国选项是 Google 的 Gemma 4 31B（排名 39）、Nemotron 3 Super（排名 36）和 OpenAI 的 gpt-oss-120b（排名 33）。

NVIDIA just announced the release of Nemotron 3 Ultra in Jensen Huang's Computex keynote: at 550B parameters (55B active), this is the largest Nemotron 3 model to date, and it is the most intelligent US open weights model

We partnered with @nvidia to evaluate this model for… pic.twitter.com/WPXZGLBOn8

— Artificial Analysis (@ArtificialAnlys) June 1, 2026

与前身相比，差距是惊人的。 Nemotron 3 Super 于 2026 年 3 月发布，拥有 1200 亿个参数，已经被认为是自主代理的可靠开放模型。 Ultra 比它高出 12 个指数点，在这个基准测试环境中这是一个巨大的飞跃。

什么是 Nemotron 系列

Nvidia 从事模型业务的时间比大多数人意识到的要长。第一款 Nemotron 品牌型号于 2023 年 11 月推出，第三代型号于 2025 年 12 月发布。

该系列分为三种规模：适用于轻量级任务的 Nano、适用于中型企业应用程序的 Super 以及适用于复杂推理工作负载的 Ultra。这三者共享相同的混合架构，结合了 Mamba-2 层、标准 Transformer 注意力和混合专家路由。

Mamba-2 是标准注意力的替代方案，它以一小部分成本处理长序列——当您想要一个能够在内存中同时保存一百万个令牌的模型时，这是相关的。 Nemotron 3 Ultra 支持 100 万个令牌上下文窗口，这意味着理论上，代理可以同时查看整个大型代码库或数百个研究文档。

&amp;amp;amp;lt;span style="宽度：0px；溢出：隐藏；行高：0" data-mce-type="bookmark" class="mce_SELRES_start"&amp;amp;gt;&amp;amp;lt;/span&amp;amp;gt;

Ultra 模型还包括一种称为多令牌预测 (MTP) 的技术，该技术使模型可以一次预测多个未来令牌，而不是一次预测一个，从而加快生成速度。所有三个 Nemotron 3 模型均使用跨多个交互环境的强化学习进行后期训练，教它们计划和执行多步骤任务，而不仅仅是回答问题。

Ultra 的重量是公开的，其训练食谱也正在发布。你需要一台超级计算机来运行它吗？从本质上讲，是的，数据中心区域内存在 5500 亿个参数的模型。但您可以通过 Nvidia 的 API 或云提供商访问它，而无需自己拥有硬件，就像任何人都已经通过浏览器使用 GPT 或 Claude 一样。

快速模型，较慢的大脑

速度故事是 Nemotron 3 Ultra 真正脱颖而出的地方。在预发布版 DeepInfra 端点上，该模型每秒提供超过 300 个输出令牌。目前，中国智能类模型 DeepSeek V4 Pro 和 Kimi K2.6 通过其商业 API 的速度为每秒 50-100 个令牌。这种速度差距对于现实世界的部署很重要，特别是对于执行长时间的多步骤任务的自主代理来说，其中等待每个步骤的速度很快就会增加。

但是原始速度并不能解决情报竞赛。发布的人工分析图表清楚地讲述了真实的故事。在垂直轴（智能）上，Nemotron 3 Ultra 排名 48，这很好，但来自 Moonshot AI 的中国 Kimi K2.6 排名 54。指数上的 6 分差距代表了一个有意义的差异：Kimi K2.6 于 2026 年 4 月发布，目前在全球所有人工智能模型中排名第四，无论是封闭式还是开放式，仅落后 Anthropic、Google 和 OpenAI 的专有旗舰产品 3 分，均在57.

美国的公开重量级情况并不新鲜。中国实验室一直在向开放生态系统提供强大的模型，而美国公司——OpenAI、Anthropic、谷歌——则将他们最好的系统保留在 API 后面。正如 Decrypt 在 3 月份报道的，中国开源模型从 2024 年末占全球开放模型使用量的约 1.2% 跃升至 2025 年底的 30% 左右。Nvidia 是积极试图扭转这一趋势的美国最大品牌，其公开披露的五年计划将在开放权重人工智能上投入 260 亿美元发展。

Nemotron 3 Ultra 是迄今为止该赌注最明显的结果。 Nvidia 还宣布已经开始开发 Nemotron 4（下一代），该联盟是通过 Nemotron 联盟开发的，该联盟由 8 个人工智能实验室组成，包括 Mistral AI 和 Perplexity，Nvidia 于 2026 年 3 月组建了该实验室，共同开发 DGX 云基础设施上的开放前沿模型。 Nemotron 3 Ultra 将于 6 月 4 日发货。