原文链接:https://mp.weixin.qq.com/s/Y3iYhjClsE9ktLfJTrQG4Q
- 主流的模仿学习方法常受困于mode collapse,无法生成多样化的轨迹。
- 现有生成式方法难以将安全约束和物理约束直接融入生成过程,需额外增加优化阶段来修正输出结果。
为解决这些局限,北交、轻舟、燕山大学、澳洲昆士兰大学的团队提出了CATG——一种基于Constrained flow matching的规划框架。具体而言,CATG显式建模flow matching过程,这一过程本质上可缓解mode collapse,并支持多种条件信号的灵活引导。我们的核心贡献包括:其一,在flow matching过程中创新性地引入显式约束,确保生成轨迹符合关键的安全规则和运动学准则;其二,将驾驶激进程度参数化为生成过程中的控制信号,实现对轨迹风格的精准调控。值得注意的是,在NavSim v2挑战赛中,CATG以51.31的EPDMS得分获得亚军,并荣获创新奖。
论文标题:Beyond Imitation: Constraint-Aware Trajectory Generation with Flow Matching For End-to-End Autonomous Driving
论文链接:https://arxiv.org/abs/2510.26292,也在找点子优化端到端模型的同学可以仔细看看。
一、背景回顾
端到端多模态规划已成为自动驾驶系统中的关键方法,与单轨迹预测方法相比,它在推理阶段显著提升了鲁棒性和适应性。这种能力在模糊或高度交互的驾驶场景中尤为重要——例如无保护左转、密集车流汇入或路口通行等场景,此时多条截然不同的轨迹可能均具备合理性。尽管具备这些优势,大多数当代多模态方法仍依赖模仿学习框架。这类方法从有限的专家示范轨迹中学习,由于真实轨迹的策略多样性不足,往往导致预测结果同质化,缺乏行为多样性。
为应对这些缺陷,研究人员提出了多种替代策略。一系列工作引入生成模型(如扩散过程)以捕捉更广泛的合理轨迹分布。然而,许多此类方法并未显式监督生成去噪过程,仍严重依赖行为克隆目标,因此仍易受mode collapse影响。另一类范式则更进一步,完全依赖生成模型进行轨迹规划,摒弃了模仿学习的使用。尽管这些方法受益于生成模型的特性,但也带来了新的挑战:噪声初始化的随机性可能导致预测结果方差过大,且缺乏硬约束集成机制(如避障或遵守交通规则),影响了生成轨迹的安全性和可解释性。
为解决这些局限,本文提出CATG——一种基于flow matching的新型轨迹生成框架,该框架彻底摒弃模仿学习,同时支持在生成过程中灵活注入显式约束。我们的贡献主要体现在三个方面:
- (1) 新的生成框架:提出基于flow matching的多模态轨迹生成器CATG,与传统方法不同,它无需依赖模仿学习,且支持多样化、灵活的条件控制。
- (2) 约束引导生成:通过渐进式机制将可行性约束和安全约束显式集成到生成过程中——利用先验感知锚点设计构建约束引导的概率流,并通过基于能量的引导进一步将轨迹导向可行区域。
- (3) 奖励条件可控性:将环境奖励信号作为条件输入,在推理阶段实现激进驾驶风格与保守驾驶风格之间的可控权衡。
CATG在ICCV NAVSIM V2端到端驾驶挑战赛中经过了广泛评估,展现出卓越的规划精度和对分布外数据的稳健泛化能力。结合开源评分模型,CATG取得了51.31的EPDMS得分。
二、预备知识

三、方法详解

灵活的条件信号



约束感知轨迹生成

以奖励为条件
为在推理阶段控制轨迹激进程度,CATG将自车过程(EP)得分用作条件信号。该得分通过在NAVSIM模拟器中评估NavTrain数据集中的每条真实轨迹得到。推理时,若将EP条件设为1,模型会倾向于生成更激进的驾驶行为。
四、实验结果
实验设置

实验结果
本文提出的CATG架构在NAVSIM V2中的实验结果如表1所示。

五、局限性
采用100步采样生成轨迹的计算成本仍然较高,而加速采样过程又可能导致轨迹质量下降。因此,未来研究的一个重要方向是在提升采样效率的同时,保持生成轨迹的质量。
六、结论
本文提出一种基于flow matching的端到端规划器,该方法能够融入灵活的条件信号以控制轨迹生成,此外还创新性地提出三种不同策略,在生成过程中施加显式约束。表1所示的实验结果表明,本文框架取得了51.31的EPDMS得分。

发表回复