导航菜单
首页
排名 涨幅榜 跌幅榜 24h成交额 新币榜
快讯 机构 观点 人物 专题

NVIDIA Cosmos 3 加速物理 AI 开发

NVIDIA 推出 Cosmos 3,这是一个世界基础模型,旨在通过高级推理和动作生成彻底改变机器人、自动驾驶汽车和视觉 AI。

NVIDIA Cosmos 3 Supercharges Physical AI Development

NVIDIA 推出了 Cosmos 3,这是其最新的世界基础模型,旨在改变物理 AI 系统的开发。 Cosmos 3 在 COMPUTEX 2026 期间于 GTC 台北展会上宣布,将视觉推理、多模态生成和动作预测集成到单一平台中。这项创新有望加速机器人、自动驾驶汽车和视觉人工智能领域的进步,使这些系统能够在现实环境中“先思考后行动”。

与之前的迭代不同,Cosmos 3 是第一个将合成世界生成与实时推理和动作模拟相结合的模型。使用其混合变形金刚架构,该模型可以解释场景、预测结果并生成动作数据。例如,它允许机器人为抓取、移动和放置物体等任务创建精确的轨迹。开发人员还可以针对特定环境微调模型,确保适应独特的工业或运营需求。

弥合人工智能模型与现实世界行动之间的差距

物理人工智能系统经常会遇到不可预见的情况,例如行人闯入交通或机器人遇到不熟悉的仓库布局。 Cosmos 3 通过生成模拟现实条件的合成数据来解决这一挑战,使开发人员能够在现实生活中难以捕捉的罕见或复杂场景中训练系统。这些能力对于物流、制造和自动驾驶等行业尤其有价值。

该模型生成动作条件数据的能力使其成为机器人政策制定的游戏规则改变者。像 Agile Robots 这样的公司已经在利用 Cosmos 3 进行人形机器人和工业机器人训练,而 NVIDIA 自己的 GEAR 团队则利用它来增强机器人在模拟和实际部署中的推理和行动规划。

将应用扩展到智慧城市和基础设施

除了机器人技术之外,Cosmos 3 还被集成到智慧城市和工业应用中。其视觉语言推理模块使人工智能系统能够解释复杂环境中的活动,从分析交通模式到检测工厂运营中的异常情况。例如,Linker Vision 使用 Cosmos 3 通过分析实时视频源并为城市规划提供可行的见解来优化城市基础设施。

值得注意的是,Cosmos 3 在 VANTAGE-Bench 等基准测试中被评为顶级开放视觉语言模型,巩固了其作为智能基础设施场景理解和预测领域领导者的地位。

对 NVIDIA 和物理 AI 的战略影响

Cosmos 3 代表了 NVIDIA 更广泛地推进物理 AI 领域的重要一步,该领域的高管在 GTC 2026 期间强调了这一关键计算平台的转变。通过将其功能与 NVIDIA 的 Omniverse 和 Isaac 机器人平台相结合,Cosmos 3 为开发、测试和部署物理 AI 解决方案提供了一个强大的生态系统。

自 2025 年首次推出以来,Cosmos 平台一直是 NVIDIA 主导物理 AI 领域战略的基石。通过 Cosmos 3,该公司加倍致力于实现推动跨行业突破的通用模型。早期采用者包括机器人公司和汽车人工智能开发商,强调了它重塑依赖复杂现实世界交互的行业的潜力。

如何访问 Cosmos 3

开发人员可以开始在 NVIDIA 的构建平台上试验 Cosmos 3,从Hugging Face下载开放模型,或通过 GitHub 自定义工作流程。该模型在 OpenMDW 1.1 许可证下可用,简化了培训、修改和部署管道的使用。

随着 NVIDIA 不断扩展其开放模型系列,Cosmos 3 使该公司处于物理 AI 创新的前沿,其广泛的应用涵盖机器人、智能城市和自动驾驶汽车。对于开发人员和行业利益相关者来说,它是大规模应对现实世界挑战的关键工具。

书签