原文链接:https://mp.weixin.qq.com/s/nIZp5NcxO9yn1Mr0UwJwCQ
论文链接:https://arxiv.org/pdf/2506.21121
摘要
本文介绍了GoIRL:多模态轨迹预测中面向图的逆强化学习。由于对周围智能体的轨迹预测存在固有的不确定性和潜在的多模态,因此这在自动驾驶中是一项具有挑战性的任务。与主要依赖于监督学习的主流数据驱动方法不同,本文引入了一种新型的面向图的逆强化学习(GoIRL)框架,这是一种使用矢量化上下文表示的基于逆强化学习(IRL)的预测器。本文开发了一种特征适配器,它能够有效地将车道图特征聚合到网格空间中,实现与最大熵IRL范式的无缝集成,以推理奖励分布,并且获得可以采样来生成多模态可行规划的策略。此外,本文根据采样的规划,实现了一个分层参数化轨迹生成器,它通过优化模块来提高预测准确性以及概率融合策略来提升预测置信度。大量实验结果表明,相比于现有的监督模型,本文方法不仅在大规模Argoverse和nuScenes运动预测基准上实现了最先进的性能,还展现出了卓越的泛化能力。
主要贡献
本文的主要贡献总结如下:
1)本文提出了一种新型的面向图的逆强化学习(GoIRL)框架,用于多模态轨迹预测任务。据作者所知,这是首个通过所提出的特征适配器将最大熵IRL范式与矢量化上下文表示相结合的框架;
2)本文引入了一种用于提高预测准确性的分层参数化轨迹生成器和一种用于提升预测置信度的马尔可夫链蒙特卡洛采样(MCMC)增强的概率融合策略;
3)本文方法在两个大规模运动预测基准(即Argoverse和nuScenes)上实现了最先进的性能。此外,与现有的监督模型相比,它在处理可行驶区域变化方面展现出更优的泛化能力。
论文图片和表格










总结
本文引入了GoIRL,这是一种面向图的逆强化学习框架,用于多模态轨迹预测任务。据作者所知,GoIRL是首个通过所提出的特征适配器将最大熵IRL范式与基于图的上下文表示相结合的运动预测方案,它有助于有效的场景特征提取和聚合。此外,分层参数化轨迹生成器显著提高了预测准确性,同时MCMC增强的概率融合策略提升了预测置信度。在大规模运动预测基准上的实验结果表明,GoIRL在生成符合场景的多模态未来轨迹方面表现出色,并且优于当前最先进的方法。与现有的监督模型相比,IRL范式的优势还赋予了GoIRL出色的泛化能力和领域适应能力,使其能够有效地应对分布偏移挑战,例如可行驶区域变化。本项工作突出了基于IRL的运动预测器的有效性,并且为进一步的研究提供了有前景的基线。未来工作将着重于扩展IRL范式,以涵盖联合多智能体轨迹预测。

发表回复