Robotaxi + 人形机器人，英伟达如何收网物理 AI？-车市号

Robotaxi + 人形机器人，英伟达如何收网物理 AI？

42号车库

2026-06-02

6 月 1 日拉开帷幕的 2026 年英伟达 GTC 台北大会上，身穿标志性皮衣的黄仁勋再次向全球科技界抛出了多项最新进展，包括 Vera Rubin 开启量产，进军 AI PC 芯片，以及 Cosmos 3 全模态模型。

在智能汽车和自动驾驶方面，英伟达全新发布了 320 亿参数的 VLA 推理模型 Aplamayo 2 Super。对比此前 100 亿参数的 Alpamayo 1.5，参数量提升了 3 倍以上。同时，从此前的前摄像头感知，拓展到 360 度感知，还新增了元动作输出等多种新特性。

随着 Alpamayo 2 Super 一同发布的还有全新工具、模型及智能体技能，这将构建起从现实世界数据采集、闭环训练到车端部署的完整流水线，包括 NVIDIA AlpaGym、NVIDIA OmniDreams 及全新的 NVIDIA Omniverse NuRec 模型。

这也意味着，英伟达在自动驾驶领域的软硬一体布局再进一步。对于车企或自动驾驶公司而言，开源的 Alpamayo 2 Super 教师模型可被蒸馏为紧凑型模型运行在车端。车端硬件可以是 Thor，也可以是 Hyperion 参考设计，全部来自英伟达。因此车企或自动驾驶公司将会简化相当多的开发流程，不需要从头开始。

与此同时，英伟达还宣布与多家公司达成 L4 自动驾驶领域的合作。其中包括制造业企业富士康、新势力车企 VinFast，以及 Uber、HUMAIN 两个网约车平台。

本质上，一辆自动驾驶汽车，就是一个依靠四轮行驶的复杂机器人。两者面临着相同的技术命题：如何在充满不确定性的三维物理世界中进行高精度的场景感知、实时推理博弈，并做出安全的闭环决策与动作执行。

因此，在英伟达 GTC 台北大会上，黄仁勋也公布了开放人性机器人惨开设计。基于宇树 H2 机器人本体、双 Sharpa Wave 触觉五指灵巧手，以及最重要的 NVIDIA Jetson AGX Thor T5000 本体计算模块，实现 2,070 FP4 TFLOPS 算力。包括 Ai2、苏黎世联邦理工学院、斯坦福机器人中心以及加州大学圣迭戈分校先进机器人与控制实验室在内的多家领先研究机构将采用该人形机器人参考设计，推进前沿人形机器人研究。

从底层的智能体推理模型，到顶层的全球出行网络部署，英伟达已经不仅是「卖铲人」或是芯片供应商，它正在重塑 AI 产业的游戏规则。

Alpamayo 2 Super 重塑汽车大脑

过去几年，自动驾驶行业一直处于苦战之中。传统基于规则的算法，或者单纯依赖海量数据堆砌的模仿学习模型，在面对现实世界中无穷无尽的长尾场景时，往往显得捉襟见肘。

如何让汽车像人类老司机一样，不仅能看到路，还能理解复杂的交通博弈并做出合理推理？英伟达给出的最新解法 Alpamayo 2 Super 亮相了。

Alpamayo 2 Super 基于 NVIDIA Cosmos 世界基础模型构建，拥有 320 亿参数，相较于此前 100 亿参数的 Alpamayo 1.5，它实现了 3 倍以上的参数规模扩张。参数量的增加，意味着 Alpamayo 2 Super 将会显著提升长尾场景中的推理、3D 空间理解和轨迹预测能力。

在感知层面，Alpamayo 2 Super 从前向摄像头感知升级到涵盖前、侧、后方的 360 度全景感知。全景视野为模型提供了更完整的场景信息输入，能够提升车辆在变道、并线和交叉路口通行时的安全性。

在决策层面，该模型引入了「元动作（Meta-Action）」输出机制。这意味着模型不仅能够预测轨迹和追踪因果链，还能输出包括让行、变道和停车等在内的宏观高级驾驶决策，为下游规划系统提供了更具逻辑性和可解释性的指令。

大模型的演进高度依赖于高质量的数据喂养与验证环境。为配合 Alpamayo 2 Super 的落地，英伟达同步推出了一系列开发工具。

在学术界和工业界，自动驾驶模型的训练一直饱受「开环评估」的困扰。所谓的开环训练，是指根据已经记录好的历史数据来评估模型的单轮动作。但在真实驾驶中，自动驾驶系统的任何一次微小决策（比如一次不恰当的刹车或转向选择）都会实时改变周围车辆与行人的反应。静态的数据集无法模拟这种互动的连锁反应，这就是所谓的「复合错误」。

为了解决这一痛点，英伟达推出了开源、高吞吐量的闭环强化学习框架 NVIDIA AlpaGym。

AlpaGym 基于 AlpaSim 微服务仿真栈和 NVIDIA Omniverse NuRec 构建。它让模型在虚拟环境中经历连续的决策与观察循环，每一次动作选择都会实时反作用于环境，从而把静态数据集所忽略的边缘故障与复合错误彻底暴露出来。

此外，以往数据管线中最昂贵、最耗时的环节是人工标注。英伟达此次开源了因果链自动标注流水线，能够从原始驾驶视频片段中自动生成具备决策因果关联的标签，无需人工干预。这种技术将基础模型的标注周期从几个月压缩至几天，大幅提升效率。

Alpamayo 2 Super 及其配套工具链的推出，为自动驾驶公司和车企提供了一个标准化的底层基建。作为「教师模型」，它可以蒸馏到较小的模型中，并运行在 Thor 或者 Hyperion 参考设计上。

驱动 Robotaxi 全球落地

如果说推理模型解决了自动驾驶系统的思考问题，那么如何将这些智能机器安全、高效地接入商业网络并实现盈利，则是整个行业面临的下一道考题。

在此次 GTC 大会上，英伟达宣布将拓展 L4 级自动驾驶合作，将其版图进一步扩大到亚洲、欧洲和中东的汽车制造商、Tier 1 和网约车平台。

在英伟达 GTC 台北大会上，英伟达宣布与富士康进一步扩大合作，将整合富士康的委托设计与制造服务能力，基于 NVIDIA DRIVE Hyperion 平台，推动 L4 级电动汽车的快速集成、规模化推进与部署。

根据规划，这一项目的首批部署将在中国启动，高雄市或将成为首批部署城市之一，并逐步扩展至亚洲其他市场。富士康计划，2028 年正式推出 Robotaxi 服务，首批线路将连接机场与市区，此后将沿铁路网络进行扩展。

针对路况更为复杂的东南亚市场，造车新势力 VinFast 与自动驾驶软件公司 Autobrains 合作，引入基于 NVIDIA DRIVE Hyperion 平台的 L4 级自动驾驶车辆。

此外在欧洲，Uber 也正与 Autobrains 合作，双方将于今年晚些时候在德国慕尼黑推出基于 NVIDIA DRIVE Hyperion 的无人驾驶出租车项目。该项目集成了 Autobrains 的代理式 AI 自动驾驶软件，车企只用制造 L4 自动驾驶硬件，就能利用其软件实现自动驾驶。这样一来，Uber 在欧洲网约车市场版图也会持续扩大。

在中东地区，HUMAIN 正在利用 NVIDIA DRIVE Hyperion，将 Robotaxi 引入沙特。

基于宇树 H2 打造机器人参考平台

如果说智能汽车是带有轮子的物理 AI，那么通用人形机器人则是物理 AI 在更广泛产业落地中的终极形态。黄仁勋在大会上指出：「人形机器人将把物理 AI 带到全球最大的各个产业，开启一个价值数万亿美元的经济机遇。」

然而，当前全球研究人员在开发通用人形机器人时，依然面临着高度碎片化的开发流程，涵盖了硬件集成、数据采集、仿真模拟、模型训练、评估以及最终部署等各个环节。为了打破这种各个环节相互割裂的专有黑盒状态，英伟达推出了首款开放的人形机器人参考设计—— NVIDIA Isaac GR00T 人形机器人参考平台。

这套设计将顶尖的硬件（本体）与开放软件栈（大脑）高度集成在一起，试图通过标准化的模件消除研究团队「重复造轮子」的基建负担。

该参考平台在硬件端集成了目前行业内顶尖的减速器和电机方案，构成了一个适用于人类尺度环境下的测试身体：

本体：采用宇树 H2 Plus 人形机器人，身高约 1.82 米，体重约 68 公斤，全身拥有 31 个自由度。

灵巧操作端：配备双 Sharpa Wave 触觉五指灵巧手，具备 22 个自由度，使机器人全身及双手总自由度达到 75 个，灵巧操作的作业范围可以更强。

执行器控制力矩：实现全身控制，手臂扭矩最高达 120 N·m，腿部扭矩最高达 360 N·m。手臂额定负载 7 公斤，峰值负载可达 15 公斤，确保了机器人在真实工况下的抓举能力。

传感器感知：多视角感知网络包括一个头部安装的广角立体摄像头（水平视场角 140°，垂直视场角 102°）、用于近距离操作的手腕摄像头，以及用于运动追踪的惯性测量单元（IMU）。

为了满足物理AI在动态变化的环境中做到精准移动、交互与操作的严苛要求，该参考设计将算力核心直接内置于机器人本体中。

它集成了 NVIDIA Jetson AGX Thor T5000 本体计算模块，其搭载的 NVIDIA Blackwell GPU 可提供高达 2,070 FP4 TFLOPS 的 AI 性能，同时配备 14 核 Arm CPU、128 GB 统一内存，功耗范围可在 40W-130W 之间动态配置，专为实时传感器处理和端侧机器人推理设计。

这一参考设计不仅有强大的本体，英伟达还提供了人性机器人开发的全栈平台 Isaac GR00T。这一平台包括用于采集高质量机器人示范数据的 NVIDIA Isaac Teleop；用于多任务行为推理的 Isaac GR00T 开放基础模型；用于在实际部署前进行仿真与策略训练的 NVIDIA Isaac Sim 和 Isaac Lab；以及负责将训练好的策略部署到硬件上的加速版 NVIDIA Isaac ROS 中间件。

模块化的设计允许研究人员完全掌控自己的机器人数据、训练数据、遥测数据及日志。目前，包括 Ai2、苏黎世联邦理工学院、斯坦福机器人中心以及加州大学圣迭戈分校在内的多家研究机构均将采用该参考设计。根据规划，今年年底宇树科技将正式推出这一人形机器人参考平台。

英伟达这种软硬一体的开放标准，正在加速机器人等前沿科学研究在物理硬件上的创意转化速度。

无论是通过双足移动的人形机器人，还是通过四轮行驶的自动驾驶汽车，它们面临的终极技术挑战都是相同的：如何让机器在不确定环境中进行感知、推理并安全运行。通过将视觉-语言-动作（VLA）大模型作为「大脑」，将高吞吐量的闭环仿真系统作为「训练场」，英伟达实际上正在用同一套方法论同时赋能这两个领域。

随着底层大模型、开放参考设计、仿真工具链以及全球工业制造生态的逐步成熟，汽车与机器人之间的传统边界正在快速消融。未来的交通工具将不再仅仅是履行运载功能的载具，而是具备高级推理能力、融入全球数字与物理网络运行的轮式智能机器人。物理 AI 的技术交汇，正在以前所未有的速度改变着人类与机器共处的世界。

声明：本文由车市号作者撰写，仅代表个人观点，不代表网上车市。文中部分图片来源网络，感谢原作者。