导航菜单
首页
排名 涨幅榜 跌幅榜 24h成交额 新币榜
快讯 机构 观点 人物 专题

Nvidia 发布了迄今为止最好的开放人工智能模型,但仍落后于中国

周日,黄仁勋穿着皮夹克走上台北国际电脑展的舞台,并推出了 Nemotron 3 Ultra——Nvidia 有史以来最大的开放式人工智能模型,至少目前是美国制造的最智能的开放式重量模型。很好。只是还不足以击败中国。

该模型包含大约 5500 亿个总参数,但在任何给定时刻仅在 550 亿个活跃参数上运行,采用了一种称为“专家混合”的设计。参数决定了人工智能模型的知识广度,参数越多通常意味着功能越强大。

要了解专家混合模式的工作原理,请将其想象为一家拥有数百名专家的医院:当患者进来时,只有相关医生真正出现,而不是所有工作人员。这种方法使运行模型的成本远低于其标题参数计数所建议的成本,这正是 Nvidia 可以声称推理速度快 5 倍并且成本比同类开放权重替代方案低 30% 的原因。

独立评估机构Artificial AnalysisNvidia 合作进行预发布评估,将 Nemotron 3 Ultra 的智能指数评为 48 分。智能指数是一项综合基准,汇总了涵盖推理、编码、一般知识和代理性能的 10 项评估,得分按数字表示,越高意味着越聪明。

这使其成为美国顶级开放重量型号,遥遥领先。其次最接近的美国选项是 Google 的 Gemma 4 31B(排名 39)、Nemotron 3 Super(排名 36)和 OpenAI 的 gpt-oss-120b(排名 33)。

与前身相比,差距是惊人的。 Nemotron 3 Super 于 2026 年 3 月发布,拥有 1200 亿个参数,已经被认为是自主代理的可靠开放模型。 Ultra 比它高出 12 个指数点,在这个基准测试环境中这是一个巨大的飞跃。

什么是 Nemotron 系列

Nvidia 从事模型业务的时间比大多数人意识到的要长。第一款 Nemotron 品牌型号于 2023 年 11 月推出,第三代型号于 2025 年 12 月发布。

该系列分为三种规模:适用于轻量级任务的 Nano、适用于中型企业应用程序的 Super 以及适用于复杂推理工作负载的 Ultra。这三者共享相同的混合架构,结合了 Mamba-2 层、标准 Transformer 注意力和混合专家路由。

Mamba-2 是标准注意力的替代方案,它以一小部分成本处理长序列——当您想要一个能够在内存中同时保存一百万个令牌的模型时,这是相关的。 Nemotron 3 Ultra 支持 100 万个令牌上下文窗口,这意味着理论上,代理可以同时查看整个大型代码库或数百个研究文档。

Ultra 模型还包括一种称为多令牌预测 (MTP) 的技术,该技术使模型可以一次预测多个未来令牌,而不是一次预测一个,从而加快生成速度。所有三个 Nemotron 3 模型均使用跨多个交互环境的强化学习进行后期训练,教它们计划和执行多步骤任务,而不仅仅是回答问题。

Ultra 的重量是公开的,其训练食谱也正在发布。你需要一台超级计算机来运行它吗?从本质上讲,是的,数据中心区域内存在 5500 亿个参数的模型。但您可以通过 Nvidia 的 API 或云提供商访问它,而无需自己拥有硬件,就像任何人都已经通过浏览器使用 GPT 或 Claude 一样。

快速模型,较慢的大脑

速度故事是 Nemotron 3 Ultra 真正脱颖而出的地方。在预发布版 DeepInfra 端点 上,该模型每秒提供超过 300 个输出令牌。目前,中国智能类模型 DeepSeek V4 Pro 和 Kimi K2.6 通过其商业 API 的速度为每秒 50-100 个令牌。这种速度差距对于现实世界的部署很重要,特别是对于执行长时间的多步骤任务的自主代理来说,其中等待每个步骤的速度很快就会增加。

但是原始速度并不能解决情报竞赛。发布的人工分析图表清楚地讲述了真实的故事。在垂直轴(智能)上,Nemotron 3 Ultra 排名 48,这很好,但来自 Moonshot AI 的中国 Kimi K2.6 排名 54。指数上的 6 分差距代表了一个有意义的差异:Kimi K2.6 于 2026 年 4 月发布,目前在全球所有人工智能模型中排名第四,无论是封闭式还是开放式,仅落后 Anthropic、Google 和 OpenAI 的专有旗舰产品 3 分,均在57.

美国的公开重量级情况并不新鲜。中国实验室一直在向开放生态系统提供强大的模型,而美国公司——OpenAI、Anthropic、谷歌——则将他们最好的系统保留在 API 后面。正如 Decrypt 在 3 月份报道的,中国开源模型从 2024 年末占全球开放模型使用量的约 1.2% 跃升至 2025 年底的 30% 左右。Nvidia 是积极试图扭转这一趋势的美国最大品牌,其公开披露的五年计划将在开放权重人工智能上投入 260 亿美元发展。

Nemotron 3 Ultra 是迄今为止该赌注最明显的结果。 Nvidia 还宣布已经开始开发 Nemotron 4(下一代),该联盟是通过 Nemotron 联盟开发的,该联盟由 8 个人工智能实验室组成,包括 Mistral AI 和 Perplexity,Nvidia 于 2026 年 3 月组建了该实验室,共同开发 DGX 云基础设施上的开放前沿模型。 Nemotron 3 Ultra 将于 6 月 4 日发货。