NVIDIA 的 Vera Rubin 平台现已全面投入生产,承诺实现 10 倍的代理 AI 吞吐量,面向全球下一代 AI 工厂。
NVIDIA 宣布其 Vera Rubin 平台即将全面投入生产,将自己定位为全球下一代“代理AI”工厂的支柱。该公告是在 GTC 台北展会期间发布的,强调与上一代 NVIDIA Grace Blackwell 架构相比,该平台能够大规模提供 10 倍的代理吞吐量。首批发货定于今年秋季开始。
Vera Rubin 代表了 NVIDIA 迄今为止集成度最高的 AI 基础设施,它将 Vera CPU、Rubin GPU 和 Spectrum-6 以太网交换机等七个尖端组件组合到一个机架级系统中。 NVL72配置是旗舰型号,将72个GPU封装到高度优化的超级计算机架中,旨在以前所未有的效率支持复杂的推理和生成式AI工作负载。
“代理 AI 是一种新型工作负载。一个提示即可启动推理、检索、工具使用和响应生成的千步旅程,”NVIDIA 创始人兼首席执行官黄仁勋表示。 “Vera Rubin 就是为这一刻而打造的——一款人工智能工厂引擎,可大规模提供智能,并具有推动下一次工业革命所需的性能、效率和安全性。”
在全球范围内扩展人工智能工厂
Vera Rubin 平台已得到广泛采用,台湾的 150 多个合作伙伴和 30 个国家/地区的 350 家工厂都在提高产量。戴尔、HPE、联想和 Supermicro 等行业重量级企业都是采用 Vera Rubin 来加速 AI 运营的系统构建商。该平台的开源 MGX 设计可实现跨不同 AI 工作负载的灵活性,使其成为超大规模企业和云提供商的游戏规则改变者。
该平台的一项关键创新是 NVIDIA Spectrum-X 以太网光子学,这是一种共同封装的光学开关技术,与传统网络解决方案相比,可将能效提高 5 倍,并将 AI 部署时间缩短 1.3 倍。这一网络突破使得能够创建用于大规模人工智能部署的“百万 GPU 工厂”,Oracle Cloud Infrastructure 和 CoreWeave 等公司都是早期采用者。
市场和战略影响
借助 Vera Rubin 平台,NVIDIA 正在加倍实施其主导 AI 生态系统的战略。通过将计算、网络和存储集成到统一系统中,该公司正在将数据中心从传统的计算集群转变为功能齐全的人工智能工厂。这种方法解决了功耗、内存带宽和多代理性能方面的关键瓶颈——这些对于万亿参数人工智能模型和实时推理任务至关重要。
该平台的潜力因其成本效益而得到凸显。 NVIDIA 声称,与之前的系统相比,Vera Rubin 的 AI 推理每个代币成本降低了 10 倍。这可以显着降低 OpenAI、Anthropic 和 Meta 等主要人工智能实验室的运营成本,这些实验室已经计划部署该平台来训练多模式模型并为长上下文人工智能工作负载提供服务。
大规模的安全性和性能
安全性是 Vera Rubin 系统的另一个基石。它采用 NVIDIA 的机密计算技术来创建可信的执行环境,通过高速互连对数据进行加密并确保操作防篡改。随着人工智能工厂处理专有和受监管的数据,这种安全级别变得越来越重要。
该平台还集成了 NVIDIA DOCA 软件层,该层以高达 800Gb/s 的速度执行零信任策略、运行时威胁检测和端到端加密。这确保了强大的多租户隔离和大规模运营可靠性——对于希望在全球范围内部署人工智能基础设施的企业来说至关重要。
下一步是什么?
随着 Vera Rubin 于今年秋季开始量产出货,NVIDIA 在人工智能基础设施领域的市场主导地位似乎将进一步加深。该平台承诺无与伦比的效率和可扩展性,可能会进一步提升其本已很高的估值,截至 2026 年 5 月,该公司的市值为 5.15 万亿美元。
对于交易者和投资者来说,NVIDIA 控制从芯片到系统的 AI 堆栈的战略可能是长期催化剂。随着人工智能采用的加速,Vera Rubin 平台可能会成为人工智能工厂的黄金标准,使 NVIDIA 成为下一波技术创新浪潮的关键参与者。
