原文链接:https://mp.weixin.qq.com/s/WYK1NAxjEJoFhH0_M2VYVQ
2025年是自动驾驶技术走向成熟的一年,要说有哪些技术让柱哥眼前一亮,有下面这几个:
当然还有小鹏VLA2.0,小米的HAD等等。也是从GTC开始,去年业内发展的基调大体确定:围绕端到端、VLA、世界模型和强化学习的一系列工程和学术突破。
所以在农历新年之后,自动驾驶之心早早就留意了NVIDIA GTC 2026。
每年的GTC 算是业内比较重要的一次人工智能大会,NVIDIA会邀请很多头部的开发者、研究人员和商业领袖参会,汇聚头部玩家的多元观点碰撞和技术行业交流。
而在自动驾驶领域NVIDIA也有很多布局,端侧芯片不必多说,一方面NVIDIA去年发布了自研的推理VLA模型Alpamayo,另一方面也会邀请很多全球范围内的公司参会分享,所以今年的GTC应该能看到国内外对自动驾驶发展的一些看法,给出一些趋势类的判断。
今年GTC自动驾驶看什么
今年GTC上自动驾驶有几个比较重要的Sessions先分享给大家:
- NVIDIA全球副总裁吴新宙:迈向 L4 级自动驾驶之路 — 打造可规模化、安全的自动驾驶汽车与 Robotaxi;
- NVIDIA高级研究总监Marco Pavone:从研究到量产 — Alpamayo 如何加速自动驾驶汽车开发;
- 特斯拉AI副总裁Ashok Elluswamy:以安全为中心的AI,打造自动驾驶的下一个时代;
- 理想汽车基座模型负责人詹锟:MindVLA-o1 — 开启全能范式,下一代统一VLA自动驾驶大模型探索;
- 小米汽车HAD算法和交付负责人陈光:端到端用于自动驾驶的强化认知框架;
- 吉利汽车集团CTO李传海:以WAM为核心构建全域AI 2.0,AI+车技术实践分享;
除此之外还有火山引擎分享智能座舱、阿里Qwen3-Omni、卓驭分享端到端世界模型、千里智驾、元戎、文远等等一共十五个主题演讲。这些主题可以大概分为几个方向:
- 云端基座:基座模型是提到最多的关键词,一是用于云端数据打标、筛选、挖掘、真值生成,二是蒸馏车端小模型,当然还可以赋能闭环仿真,也是本次GTC自动驾驶分享的核心,国外NVIDIA、Waabi、Tesla等公司会专门聊到;
- 车端部署:另一大主题就是车端模型,主要是端到端和VLA。去年提VLA的是理想汽车,今年元戎、NVIDIA等公司都会聊到,不出意外今年会是VLA全行业爆发的一年;
- 世界模型:我也单独把世界模型拎了出来,卓驭、小米和NVIDIA都会聊到这个主题,具身World Action Model最近有很多工作,今年也值得自驾重点关注;
- 智能座舱:座舱的人机交互可以重点关注下阿里的Qwen3-Omni分享。
这些主题包含的核心关键词:VLA、端到端、世界模型(或者说World-Action Model)、生成式AI、强化认知、L4、安全、推理加速等等。
透过GTC分享的主题,今年业内发展的基调应该是:通过基座模型、端到端、VLA、世界模型等这些技术底座,打造一个安全、可靠、智能的通用L2+L4自动驾驶解决方案。
NVIDIA
NVIDIA有三个Sessions:一个是吴新宙分享L4自动驾驶,另一个是自研的VLA模型Alpamayo,还有一个是NVIDIA 辅助驾驶的核心模块。
25年是L4行业融资遍地开花的一年,26年2月初Waymo拿下了150亿美元的融资,2月底Wayve官宣15亿美元融资。
这背后是国内外汽车行业的共识:自动驾驶的技术发展到了新的阶段,需要向前推进L4。而L4级商用车的技术可以沿用乘用车的经验(一段式端到端、VLA等)。
所以吴新宙副总裁会聊L4,自动驾驶之心比较感兴趣,也推荐大家关注一下。
而去年十一月,NVIDIA发布了因果链推理+实车可部署算法Alpamayo-R1 (后改名为Alpamayo 1)。从目前的信息来看,Alpamayo应该是NVIDIA为L2 + L4准备的车端量产方案,Alpamayo的主题分享介绍:
随着行业加速迈向可规模化、 由 AI 驱动的 L4 级方案,端到端自动驾驶正迎来全新突破。本次演讲将深入探讨 NVIDIA Alpamayo,特别是其视觉-语言-动作推理模型(Reasoning VLA)如何使车辆能够以更接近人类理解的方式,解读、推理并应对复杂的真实世界。演讲将重点介绍这一方案如何借助 NVIDIA Cosmos 提供的自我强化闭环不断演进,并由 NVIDIA Halos(NVIDIA 为物理 AI 打造的全栈综合安全系统)提供完善的安全保障。最后将分享NVIDIA 如何构建开放生态系统,赋能合作伙伴开发面向下一代、支持 Robotaxi 落地的自动驾驶汽车。

NVIDIA Halos是第一次听说,届时会重点关注一下。而NVIDIA Cosmos是NVIDIA推出的基座模型,会在另一个主题重点聊到 —— 「NVIDIA 加速辅助驾驶 2.0 时代 AI 定义汽车的大规模应用」,主题介绍如下:
本次演讲将介绍 NVIDIA 的辅助驾驶核心模块,从云端训练到车端推理的全栈解决方案,包括 NVIDIA Cosmos Reason(视频理解和 VLA 骨干网络)、Cosmos World Model(全局场景仿真)、 NuRec 神经重建和闭环仿真、ACCV-Lab 辅助驾驶训练工具包以及面向 NVIDIA DRIVE Thor 的 VLA 模型部署及展望。
这三个主题,基本上覆盖了NVIDIA在自动驾驶领域的布局和思考:
- 围绕物理AI打造一个通用的L2 + L4全栈解决方案:有车云平台、云端基座和仿真、车端推理和部署加速;
- 围绕车端模型主推因果链推理Alpamayo:「数据→模型→训练→部署」,开源的含金量还是很高的,NVIDIA帮你搞定所有;
- 为车端模型服务的全栈解决方案:基座模型Cosmos、为场景仿真服务的世界模型(重建 + 生成)以及车端芯片的部署和推理加速。
总的来说,2025 年是智驾 端到端“卷技术落地” 的一年,2026 年一定会变成 “卷规模化、卷降本” 的一年,而今年的 GTC,是给整个行业定调的起点。
理想汽车
理想汽车今年的分享延续去年的思路,由MindVLA进化到MindVLA-o1。倒是没有什么公开的论文可以参考,分享人也从贾鹏老师到詹锟老师。去年理想汽车的技术方案我们分享了很多,和本次主题相关联的推荐几个:
还有很多世界模型、VLA方面的进展,大家可以搜索公众号历史的文章。
理想汽车在ORIN和Thor芯片上做了E2E+VLM快慢双系统和MindVLA的量产落地,已经深度和NVIDIA绑定,未来可能也会在具身领域进一步展开合作。
MindVLA-o1主题介绍如下:
本次演讲将介绍理想汽⻋下⼀代⾃动驾驶基础模型 MindVLA-o1:基于统⼀ Vision-Language-Action 的 Omni 架构,在单⼀ Transformer 中联合建模感知、推理与控制。模型通过离散Action Tokens 与 MoE 实现⾼效、稳定的精准控制;采⽤快慢双系统推理,在实时性与复杂场景推理间⾃适应切换;并结合基于模型的强化学习闭环与软硬件协同设计,实现可量产、拟⼈化的端到端⾃动驾驶。
理想的这次分享,我认为可以看到他们在数据闭环、模型架构(云端基座+车端部署+智能座舱)、训练调优(闭环训练、RL)、端侧芯片几个维度展开,配合闭环仿真或者世界模型的一些实际效果展示。
介绍中还提到了「快慢双系统推理」,我们在一月份NVIDIA反事实推理(Counterfactual VLA)的工作中就提到:自适应推理、自反思,是当前自驾VLA模型研究的热点,也是自动驾驶未来进化的趋势。NVIDIA对技术的趋势判断踩的很准~
详情参考:NVIDIA用千万Clip搞定了反事实推理VLA!安全指标提升了20%
具体的技术分析会在18号当天和大家展开聊聊。当然,应该还会提一下为具身领域储备的一些技术,毕竟26年理想主攻具身智能。
小米汽车
小米汽车去年的技术工作很多,GTC上陈光老师会分享端到端强化认知框架。小米分享的主题是和强化学习、端到端以及闭环仿真有关,最后会提一下VLA方案的进展。主题介绍如下:
在小米汽车(Xiaomi EV),我们提出了一套全新的强化认知(Reinforced Cognitive)端到端自动驾驶框架:以“理解—预测—决策”一体化为目标,将世界模型(World Model)与强化学习(Reinforcement Learning, RL)深度融合,在同一端到端网络中同时完成驾驶环境理解与轨迹/动作规划,从而在多样化真实道路场景中显著提升行驶安全性与舒适性。
沿用的应该是25年11月小米智驾四位负责人接受flypig采访的内容,之前就提到过「1.0 规则驱动 → 2.0 数据驱动 → 3.0 认知驱动」,B站链接:
- https://www.bilibili.com/video/BV15UyMBZEJT
- https://www.bilibili.com/video/BV1fEUpBEEwD
千万Clip训练得到的车端模型,经由一个世界模型的闭环仿真器优化corner case,配合强化学习不断提升困难场景的性能。
强化认知:Reinforced Cognitive,一个是「强化」一个是「认知」。
- 「强化」指的是强化学习,毕竟模仿学习得到的端到端模型业内已经验证过 — 上限不高,需要RL进一步提升博弈交互的能力;
- 「认知」指的是世界模型,通过世界模型(仿真+重建)提升模型对物理世界的理解能力。
也推荐几篇文章:
吉利的主题没有太多公开的信息可以参考,贴一下Sessions中的简介:
汽车行业的发展正迎来一个大变革时代,处在从“功能叠加”迈向“体验融合”的关键节点,这其中的核心是“AI+车”;我们将分享吉利是如何探索,将 AI 融入智能汽车的架构、动力、底盘、座舱、辅助驾驶以及生产制造、企业发展等全链路,以及我们最新提出全域 AI 2.0 技术架构和WAM模型的实践应用。

发表回复