2026-03-11 今年NVIDIA GTC，将会是VLA、端到端和WAM的高光时刻

原文链接：https://mp.weixin.qq.com/s/WYK1NAxjEJoFhH0_M2VYVQ

2025年是自动驾驶技术走向成熟的一年，要说有哪些技术让柱哥眼前一亮，有下面这几个：

当然还有小鹏VLA2.0，小米的HAD等等。也是从GTC开始，去年业内发展的基调大体确定：围绕端到端、VLA、世界模型和强化学习的一系列工程和学术突破。

所以在农历新年之后，自动驾驶之心早早就留意了NVIDIA GTC 2026。

每年的GTC 算是业内比较重要的一次人工智能大会，NVIDIA会邀请很多头部的开发者、研究人员和商业领袖参会，汇聚头部玩家的多元观点碰撞和技术行业交流。

而在自动驾驶领域NVIDIA也有很多布局，端侧芯片不必多说，一方面NVIDIA去年发布了自研的推理VLA模型Alpamayo，另一方面也会邀请很多全球范围内的公司参会分享，所以今年的GTC应该能看到国内外对自动驾驶发展的一些看法，给出一些趋势类的判断。

今年GTC自动驾驶看什么

今年GTC上自动驾驶有几个比较重要的Sessions先分享给大家：

NVIDIA全球副总裁吴新宙：迈向 L4 级自动驾驶之路 — 打造可规模化、安全的自动驾驶汽车与 Robotaxi；
NVIDIA高级研究总监Marco Pavone：从研究到量产 — Alpamayo 如何加速自动驾驶汽车开发；
特斯拉AI副总裁Ashok Elluswamy：以安全为中心的AI，打造自动驾驶的下一个时代；
理想汽车基座模型负责人詹锟：MindVLA-o1 — 开启全能范式，下一代统一VLA自动驾驶大模型探索；
小米汽车HAD算法和交付负责人陈光：端到端用于自动驾驶的强化认知框架；
吉利汽车集团CTO李传海：以WAM为核心构建全域AI 2.0，AI+车技术实践分享；

除此之外还有火山引擎分享智能座舱、阿里Qwen3-Omni、卓驭分享端到端世界模型、千里智驾、元戎、文远等等一共十五个主题演讲。这些主题可以大概分为几个方向：

云端基座：基座模型是提到最多的关键词，一是用于云端数据打标、筛选、挖掘、真值生成，二是蒸馏车端小模型，当然还可以赋能闭环仿真，也是本次GTC自动驾驶分享的核心，国外NVIDIA、Waabi、Tesla等公司会专门聊到；
车端部署：另一大主题就是车端模型，主要是端到端和VLA。去年提VLA的是理想汽车，今年元戎、NVIDIA等公司都会聊到，不出意外今年会是VLA全行业爆发的一年；
世界模型：我也单独把世界模型拎了出来，卓驭、小米和NVIDIA都会聊到这个主题，具身World Action Model最近有很多工作，今年也值得自驾重点关注；
智能座舱：座舱的人机交互可以重点关注下阿里的Qwen3-Omni分享。

这些主题包含的核心关键词：VLA、端到端、世界模型（或者说World-Action Model）、生成式AI、强化认知、L4、安全、推理加速等等。

透过GTC分享的主题，今年业内发展的基调应该是：通过基座模型、端到端、VLA、世界模型等这些技术底座，打造一个安全、可靠、智能的通用L2+L4自动驾驶解决方案。

NVIDIA

NVIDIA有三个Sessions：一个是吴新宙分享L4自动驾驶，另一个是自研的VLA模型Alpamayo，还有一个是NVIDIA 辅助驾驶的核心模块。

25年是L4行业融资遍地开花的一年，26年2月初Waymo拿下了150亿美元的融资，2月底Wayve官宣15亿美元融资。

这背后是国内外汽车行业的共识：自动驾驶的技术发展到了新的阶段，需要向前推进L4。而L4级商用车的技术可以沿用乘用车的经验（一段式端到端、VLA等）。

所以吴新宙副总裁会聊L4，自动驾驶之心比较感兴趣，也推荐大家关注一下。

而去年十一月，NVIDIA发布了因果链推理+实车可部署算法Alpamayo-R1 (后改名为Alpamayo 1）。从目前的信息来看，Alpamayo应该是NVIDIA为L2 + L4准备的车端量产方案，Alpamayo的主题分享介绍：

随着行业加速迈向可规模化、由 AI 驱动的 L4 级方案，端到端自动驾驶正迎来全新突破。本次演讲将深入探讨 NVIDIA Alpamayo，特别是其视觉-语言-动作推理模型（Reasoning VLA）如何使车辆能够以更接近人类理解的方式，解读、推理并应对复杂的真实世界。演讲将重点介绍这一方案如何借助 NVIDIA Cosmos 提供的自我强化闭环不断演进，并由 NVIDIA Halos（NVIDIA 为物理 AI 打造的全栈综合安全系统）提供完善的安全保障。最后将分享NVIDIA 如何构建开放生态系统，赋能合作伙伴开发面向下一代、支持 Robotaxi 落地的自动驾驶汽车。

NVIDIA Halos是第一次听说，届时会重点关注一下。而NVIDIA Cosmos是NVIDIA推出的基座模型，会在另一个主题重点聊到 —— 「NVIDIA 加速辅助驾驶 2.0 时代 AI 定义汽车的大规模应用」，主题介绍如下：

本次演讲将介绍 NVIDIA 的辅助驾驶核心模块，从云端训练到车端推理的全栈解决方案，包括 NVIDIA Cosmos Reason（视频理解和 VLA 骨干网络）、Cosmos World Model（全局场景仿真）、 NuRec 神经重建和闭环仿真、ACCV-Lab 辅助驾驶训练工具包以及面向 NVIDIA DRIVE Thor 的 VLA 模型部署及展望。

这三个主题，基本上覆盖了NVIDIA在自动驾驶领域的布局和思考：

围绕物理AI打造一个通用的L2 + L4全栈解决方案：有车云平台、云端基座和仿真、车端推理和部署加速；
围绕车端模型主推因果链推理Alpamayo：「数据→模型→训练→部署」，开源的含金量还是很高的，NVIDIA帮你搞定所有；
为车端模型服务的全栈解决方案：基座模型Cosmos、为场景仿真服务的世界模型（重建 + 生成）以及车端芯片的部署和推理加速。

总的来说，2025 年是智驾端到端“卷技术落地” 的一年，2026 年一定会变成 “卷规模化、卷降本” 的一年，而今年的 GTC，是给整个行业定调的起点。

理想汽车

理想汽车今年的分享延续去年的思路，由MindVLA进化到MindVLA-o1。倒是没有什么公开的论文可以参考，分享人也从贾鹏老师到詹锟老师。去年理想汽车的技术方案我们分享了很多，和本次主题相关联的推荐几个：

还有很多世界模型、VLA方面的进展，大家可以搜索公众号历史的文章。

理想汽车在ORIN和Thor芯片上做了E2E+VLM快慢双系统和MindVLA的量产落地，已经深度和NVIDIA绑定，未来可能也会在具身领域进一步展开合作。

MindVLA-o1主题介绍如下：

本次演讲将介绍理想汽⻋下⼀代⾃动驾驶基础模型 MindVLA-o1：基于统⼀ Vision-Language-Action 的 Omni 架构，在单⼀ Transformer 中联合建模感知、推理与控制。模型通过离散Action Tokens 与 MoE 实现⾼效、稳定的精准控制；采⽤快慢双系统推理，在实时性与复杂场景推理间⾃适应切换；并结合基于模型的强化学习闭环与软硬件协同设计，实现可量产、拟⼈化的端到端⾃动驾驶。

理想的这次分享，我认为可以看到他们在数据闭环、模型架构（云端基座+车端部署+智能座舱）、训练调优（闭环训练、RL）、端侧芯片几个维度展开，配合闭环仿真或者世界模型的一些实际效果展示。

介绍中还提到了「快慢双系统推理」，我们在一月份NVIDIA反事实推理（Counterfactual VLA）的工作中就提到：自适应推理、自反思，是当前自驾VLA模型研究的热点，也是自动驾驶未来进化的趋势。NVIDIA对技术的趋势判断踩的很准~

详情参考：NVIDIA用千万Clip搞定了反事实推理VLA！安全指标提升了20%

具体的技术分析会在18号当天和大家展开聊聊。当然，应该还会提一下为具身领域储备的一些技术，毕竟26年理想主攻具身智能。

小米汽车

小米汽车去年的技术工作很多，GTC上陈光老师会分享端到端强化认知框架。小米分享的主题是和强化学习、端到端以及闭环仿真有关，最后会提一下VLA方案的进展。主题介绍如下：

在小米汽车（Xiaomi EV），我们提出了一套全新的强化认知（Reinforced Cognitive）端到端自动驾驶框架：以“理解—预测—决策”一体化为目标，将世界模型（World Model）与强化学习（Reinforcement Learning, RL）深度融合，在同一端到端网络中同时完成驾驶环境理解与轨迹/动作规划，从而在多样化真实道路场景中显著提升行驶安全性与舒适性。

沿用的应该是25年11月小米智驾四位负责人接受flypig采访的内容，之前就提到过「1.0 规则驱动 → 2.0 数据驱动 → 3.0 认知驱动」，B站链接：

https://www.bilibili.com/video/BV15UyMBZEJT
https://www.bilibili.com/video/BV1fEUpBEEwD

千万Clip训练得到的车端模型，经由一个世界模型的闭环仿真器优化corner case，配合强化学习不断提升困难场景的性能。

强化认知：Reinforced Cognitive，一个是「强化」一个是「认知」。

「强化」指的是强化学习，毕竟模仿学习得到的端到端模型业内已经验证过 — 上限不高，需要RL进一步提升博弈交互的能力；
「认知」指的是世界模型，通过世界模型（仿真+重建）提升模型对物理世界的理解能力。

也推荐几篇文章：

吉利的主题没有太多公开的信息可以参考，贴一下Sessions中的简介：

汽车行业的发展正迎来一个大变革时代，处在从“功能叠加”迈向“体验融合”的关键节点，这其中的核心是“AI+车”；我们将分享吉利是如何探索，将 AI 融入智能汽车的架构、动力、底盘、座舱、辅助驾驶以及生产制造、企业发展等全链路，以及我们最新提出全域 AI 2.0 技术架构和WAM模型的实践应用。

2026-03-11 今年NVIDIA GTC，将会是VLA、端到端和WAM的高光时刻

发表回复取消回复

Categories

Archives

2026-03-11 今年NVIDIA GTC，将会是VLA、端到端和WAM的高光时刻

发表回复 取消回复

Categories

Archives

发表回复取消回复