NVIDIA 的 Alpamayo 推出自动驾驶汽车闭环后训练,提高推理能力和部署准备能力。
NVIDIA 推出了用于自动驾驶汽车 (AV) 模型的新闭环训练框架,作为其 Alpamayo 平台的一部分。 AlpaGym 系统将模拟输出直接连接到训练循环,允许 AV 策略从模拟环境中的行为后果中学习。这标志着在缩小开环训练(输出与地面实况进行比较)和闭环部署(每个决策都会影响车辆周围环境)之间的差距方面向前迈出了重要一步。
Alpamayo 平台于 CES 2026 上发布,是 NVIDIA 的视觉-语言-动作 (VLA) 模型、模拟工具和开放数据集套件,旨在加速自动驾驶开发。其旗舰模型 Alpamayo 1 拥有 100 亿个参数,集感知、因果推理和轨迹规划于一体。虽然它主要充当“教师模型”,但开发人员可以使用 AlpaGym 等训练后工作流程来微调较小的、特定于车队的模型。
为什么闭环培训很重要
在现实驾驶中,小错误(例如制动或转向方面的轻微误判)可能会累积,导致失败。 AlpaGym 支持的闭环训练通过允许 AV 模型从模拟中决策的动态反馈中学习来直接解决这个问题。这种方法揭示了静态数据集或开环评估无法揭示的故障模式。
NVIDIA 已将其 AlpaSim 模拟引擎与 Cosmos-RL 框架集成,以大规模协调分布式强化学习 (RL)。据 NVIDIA 称,该系统将 Alpamayo-R1 模型的推理质量提高了 45%,推理与动作一致性提高了 37%,实时延迟仅为 99 毫秒。 AlpaSim 能够生成从城市交通到极端天气的各种场景,进一步增加了训练过程的深度。
AlpaGym 的工作原理
开发人员可以从现有的 Alpamayo 检查点开始,并使用 AlpaGym 通过四个关键步骤来完善 AV 模型:
- 安装并配置 AlpaGym 以及 CUDA 和 Redis 依赖项。
- 定义闭环奖励结构,平衡进度指标与对碰撞或越野偏离等故障的处罚。
- 启动闭环培训,根据模拟反馈迭代改进政策。
- 导出训练后的检查点,以便在 AlpaSim 中部署或进一步评估。
该管道旨在从单 GPU 扩展到多节点集群,使探索 4 级自治的初创公司和老牌汽车制造商都可以使用它。
市场影响
截至 2026 年 5 月,NVIDIA 更广泛的 AV 生态系统正在获得关注。其 DRIVE Hyperion 平台(Alpamayo 是其关键组件)已被比亚迪、吉利和日产等主要汽车制造商采用。梅赛德斯最近推出了运行 NVIDIA 全栈 AV 软件的新款 CLA 轿车,这表明行业对 NVIDIA 技术的依赖日益增强。
随着 AV 市场预计到 2030 年将超过 2000 亿美元,NVIDIA 提供开放、可定制的 AI 平台的战略可以巩固其领导地位。通过使汽车制造商能够在专有数据上对模型进行后期训练,而无需构建核心基础设施,NVIDIA 降低了 AV 开发的准入门槛。
下一步是什么?
对 Alpamayo 感兴趣的开发人员可以访问 GitHub 上的训练后食谱,包括针对特定场景调整模型的工具。 NVIDIA 还在 CVPR 2026 上发起了公共 AV 挑战,以衡量性能,促进该领域的协作和创新。
对于投资者来说,NVIDIA 在人工智能驱动的 AV 技术领域的主导地位凸显了其增长潜力。截至 2026 年 5 月 30 日,该公司的股价已达到 5.15 万亿美元的市值,股价已达到 211.14 美元,像 Alpamayo 这样的持续进步可以进一步巩固其作为自主系统领导者的地位。
