NVIDIA Alpamayo 利用闭环技术增强 AV 模型训练

NVIDIA 的 Alpamayo 推出自动驾驶汽车闭环后训练，提高推理能力和部署准备能力。

NVIDIA Alpamayo Enhances AV Model Training With Closed-Loop Tech

NVIDIA 推出了用于自动驾驶汽车 (AV) 模型的新闭环训练框架，作为其 Alpamayo 平台的一部分。 AlpaGym 系统将模拟输出直接连接到训练循环，允许 AV 策略从模拟环境中的行为后果中学习。这标志着在缩小开环训练（输出与地面实况进行比较）和闭环部署（每个决策都会影响车辆周围环境）之间的差距方面向前迈出了重要一步。

Alpamayo 平台于 CES 2026 上发布，是 NVIDIA 的视觉-语言-动作 (VLA) 模型、模拟工具和开放数据集套件，旨在加速自动驾驶开发。其旗舰模型 Alpamayo 1 拥有 100 亿个参数，集感知、因果推理和轨迹规划于一体。虽然它主要充当“教师模型”，但开发人员可以使用 AlpaGym 等训练后工作流程来微调较小的、特定于车队的模型。

为什么闭环培训很重要

在现实驾驶中，小错误（例如制动或转向方面的轻微误判）可能会累积，导致失败。 AlpaGym 支持的闭环训练通过允许 AV 模型从模拟中决策的动态反馈中学习来直接解决这个问题。这种方法揭示了静态数据集或开环评估无法揭示的故障模式。

NVIDIA 已将其 AlpaSim 模拟引擎与 Cosmos-RL 框架集成，以大规模协调分布式强化学习 (RL)。据 NVIDIA 称，该系统将 Alpamayo-R1 模型的推理质量提高了 45%，推理与动作一致性提高了 37%，实时延迟仅为 99 毫秒。 AlpaSim 能够生成从城市交通到极端天气的各种场景，进一步增加了训练过程的深度。

AlpaGym 的工作原理

开发人员可以从现有的 Alpamayo 检查点开始，并使用 AlpaGym 通过四个关键步骤来完善 AV 模型：

安装并配置 AlpaGym 以及 CUDA 和 Redis 依赖项。
定义闭环奖励结构，平衡进度指标与对碰撞或越野偏离等故障的处罚。
启动闭环培训，根据模拟反馈迭代改进政策。
导出训练后的检查点，以便在 AlpaSim 中部署或进一步评估。

该管道旨在从单 GPU 扩展到多节点集群，使探索 4 级自治的初创公司和老牌汽车制造商都可以使用它。

市场影响

截至 2026 年 5 月，NVIDIA 更广泛的 AV 生态系统正在获得关注。其 DRIVE Hyperion 平台（Alpamayo 是其关键组件）已被比亚迪、吉利和日产等主要汽车制造商采用。梅赛德斯最近推出了运行 NVIDIA 全栈 AV 软件的新款 CLA 轿车，这表明行业对 NVIDIA 技术的依赖日益增强。

随着 AV 市场预计到 2030 年将超过 2000 亿美元，NVIDIA 提供开放、可定制的 AI 平台的战略可以巩固其领导地位。通过使汽车制造商能够在专有数据上对模型进行后期训练，而无需构建核心基础设施，NVIDIA 降低了 AV 开发的准入门槛。

下一步是什么？

对 Alpamayo 感兴趣的开发人员可以访问 GitHub 上的训练后食谱，包括针对特定场景调整模型的工具。 NVIDIA 还在 CVPR 2026 上发起了公共 AV 挑战，以衡量性能，促进该领域的协作和创新。

对于投资者来说，NVIDIA 在人工智能驱动的 AV 技术领域的主导地位凸显了其增长潜力。截至 2026 年 5 月 30 日，该公司的股价已达到 5.15 万亿美元的市值，股价已达到 211.14 美元，像 Alpamayo 这样的持续进步可以进一步巩固其作为自主系统领导者的地位。

书签