2025-11-11 模仿学习之外，端到端轨迹如何优化？轻舟一篇刷榜的工作……

原文链接：https://mp.weixin.qq.com/s/Y3iYhjClsE9ktLfJTrQG4Q

主流的模仿学习方法常受困于mode collapse，无法生成多样化的轨迹。
现有生成式方法难以将安全约束和物理约束直接融入生成过程，需额外增加优化阶段来修正输出结果。

为解决这些局限，北交、轻舟、燕山大学、澳洲昆士兰大学的团队提出了CATG——一种基于Constrained flow matching的规划框架。具体而言，CATG显式建模flow matching过程，这一过程本质上可缓解mode collapse，并支持多种条件信号的灵活引导。我们的核心贡献包括：其一，在flow matching过程中创新性地引入显式约束，确保生成轨迹符合关键的安全规则和运动学准则；其二，将驾驶激进程度参数化为生成过程中的控制信号，实现对轨迹风格的精准调控。值得注意的是，在NavSim v2挑战赛中，CATG以51.31的EPDMS得分获得亚军，并荣获创新奖。

论文标题：Beyond Imitation: Constraint-Aware Trajectory Generation with Flow Matching For End-to-End Autonomous Driving

论文链接：https://arxiv.org/abs/2510.26292，也在找点子优化端到端模型的同学可以仔细看看。

一、背景回顾

端到端多模态规划已成为自动驾驶系统中的关键方法，与单轨迹预测方法相比，它在推理阶段显著提升了鲁棒性和适应性。这种能力在模糊或高度交互的驾驶场景中尤为重要——例如无保护左转、密集车流汇入或路口通行等场景，此时多条截然不同的轨迹可能均具备合理性。尽管具备这些优势，大多数当代多模态方法仍依赖模仿学习框架。这类方法从有限的专家示范轨迹中学习，由于真实轨迹的策略多样性不足，往往导致预测结果同质化，缺乏行为多样性。

为应对这些缺陷，研究人员提出了多种替代策略。一系列工作引入生成模型（如扩散过程）以捕捉更广泛的合理轨迹分布。然而，许多此类方法并未显式监督生成去噪过程，仍严重依赖行为克隆目标，因此仍易受mode collapse影响。另一类范式则更进一步，完全依赖生成模型进行轨迹规划，摒弃了模仿学习的使用。尽管这些方法受益于生成模型的特性，但也带来了新的挑战：噪声初始化的随机性可能导致预测结果方差过大，且缺乏硬约束集成机制（如避障或遵守交通规则），影响了生成轨迹的安全性和可解释性。

为解决这些局限，本文提出CATG——一种基于flow matching的新型轨迹生成框架，该框架彻底摒弃模仿学习，同时支持在生成过程中灵活注入显式约束。我们的贡献主要体现在三个方面：

(1) 新的生成框架：提出基于flow matching的多模态轨迹生成器CATG，与传统方法不同，它无需依赖模仿学习，且支持多样化、灵活的条件控制。
(2) 约束引导生成：通过渐进式机制将可行性约束和安全约束显式集成到生成过程中——利用先验感知锚点设计构建约束引导的概率流，并通过基于能量的引导进一步将轨迹导向可行区域。
(3) 奖励条件可控性：将环境奖励信号作为条件输入，在推理阶段实现激进驾驶风格与保守驾驶风格之间的可控权衡。

CATG在ICCV NAVSIM V2端到端驾驶挑战赛中经过了广泛评估，展现出卓越的规划精度和对分布外数据的稳健泛化能力。结合开源评分模型，CATG取得了51.31的EPDMS得分。

二、预备知识