NVIDIA 推出 DSX OS,这是一款开源软件,旨在通过提高效率、可靠性和可扩展性来优化人工智能工厂运营。
NVIDIA 宣布推出 DSX OS,这是一款模块化开源操作系统,旨在简化 AI 工厂的部署和运营。 NVIDIA DSX(设计、模拟、操作)平台的这一新增功能旨在提高大规模、千兆瓦级 AI 基础设施的效率、可扩展性和可靠性。
根据 NVIDIA 的定义,AI 工厂是一种专门的基础设施,可将能源转换为 AI 模型输出(以“代币”衡量)。这些工厂的经济效益取决于最大化每瓦代币,同时最小化成本,因此运营效率至关重要。 DSX 操作系统通过提供软件工具来解决这个问题,这些工具可实现跨多租户环境的更快部署、提高电源利用率和自动运行状况监控。
DSX 操作系统的主要功能
DSX OS 无缝集成了 NVIDIA AI 堆栈的各个层(从芯片到应用程序)。以下是其核心功能:
1。更快获得收入
通过以开源方式发布其基础设施和平台软件,NVIDIA 消除了定制开发的需要。合作伙伴可以在预先验证的 DSX 堆栈上构建 AI 服务,将部署时间从几个月缩短到几周。
2。提高效率
DSX 操作系统将电源视为可编程资源,动态优化 GPU、冷却系统和工作负载之间的能量分配。据 NVIDIA 估计,此功能使 AI 工厂能够在固定功率预算内运行最多 40% 的 GPU。
3。可靠性和弹性
借助用于自动故障修复的 NVSentinel 和用于整个车队监控的车队智能等工具,DSX OS 将操作从被动转变为主动。即使在硬件故障或电网事件期间,这也可以确保一致的性能。
为什么这很重要
人工智能行业越来越依赖大规模计算基础设施来驱动机器学习模型。 NVIDIA 表示,DSX 平台将人工智能工厂运营的各个方面(从能源和芯片到软件和应用程序)整合到一个统一的框架中,使运营商能够高效扩展。以最高效率运行更多 GPU 并恢复闲置电源的能力可以转化为显着的成本节约和运营优势。
此外,DSX OS 与 NVIDIA 更广泛的生态系统(包括 KAI Scheduler 和 Cloud Functions 等组件)的兼容性,使其成为 AI 原生数据中心的关键工具。 CoreWeave、Lambda 和 ENGIE 等合作伙伴已在利用 DSX 组件来优化其运营。
市场背景
NVIDIA 标准化和优化 AI 工厂运营的努力正处于关键时刻。截至 2026 年 5 月 30 日,NVIDIA 的股价因其在 AI 硬件和软件领域的主导地位而一直走高。目前其市值为 5.15 万亿美元,反映出投资者对其人工智能优先战略的信心。随着人工智能领域的迅速扩张,DSX OS 等工具可以进一步巩固 NVIDIA 作为人工智能基础设施领导者的地位。
此外,DSX 平台补充了 Omniverse DSX Blueprint 和 Vera Rubin 参考设计等早期版本。这些工具共同提供了用于设计和运营 AI 工厂的全栈解决方案,使 NVIDIA 成为寻求扩展 AI 运营的公司的一站式商店。
展望未来
DSX OS 组件可在 GitHub 上获取,使现有 AI 工厂运营商能够逐步采用。 NVIDIA 将此版本定位为加速 AI 基础设施全球部署的更广泛战略的一部分。对于合作伙伴和运营商来说,DSX OS 提供了一条在不影响可靠性的情况下优化成本、提高效率和扩展运营的清晰途径。
随着人工智能市场预计将呈指数级增长,NVIDIA 的 DSX 操作系统可以在定义人工智能工厂的大规模运营方式方面发挥关键作用,并有可能在未来几年制定行业标准。
