2024-04-30 【香港科技大学】PLUTO:突破基于模仿学习的自动驾驶规划的限制

论文链接:https://arxiv.org/pdf/2404.14327.pdf

项目主页:https://jchengai.github.io/pluto/

摘要

本文介绍了PLUTO:突破基于模仿学习的自动驾驶规划的限制。本文提出了一个强大的框架PLUTO,其突破了基于模仿学习的自动驾驶规划的限制。本文的改进源于三个关键方面:纵向-横向感知模型架构,它实现灵活、多样化的驾驶行为;一种创新的辅助损失计算方法,对于批量计算广泛适用且效率高;一种新型的训练框架,其利用对比学习,通过一系列新的数据增强来调整驾驶行为,促进对潜在交互的理解。本文使用大规模的现实世界nuPlan数据集及其相关的标准化规划基准来评估所提出的框架。令人印象深刻的是,PLUTO实现了最先进的闭环性能,打败了其它具有竞争力的基于学习的方法,并且首次超越了当前性能最好的基于规则的规划器。

主要贡献

本文的主要贡献总结如下:

1)本文引入了一种基于查询的模型架构,该架构同时处理横向和纵向规划行为,实现了灵活、多样化的驾驶行为;

2)本文提出了一种新型的基于微分插值的辅助损失计算方法。该方法适用于广泛的辅助任务,并且允许在基于向量的模型中进行高效批量计算;

3)本文提出对比模仿学习(CIL)框架,并且提供了一组新的数据增强。CIL框架旨在调整驾驶行为和增强交互学习,而不会显著增加训练的复杂性;

4)本文对大规模nuPlan数据集的评估表明,PLUTO在闭环规划中实现了最先进的性能。本文所提出的模型和基准是开源的。

论文图片和表格

主要贡献

本文的主要贡献总结如下:

1)本文引入了一种基于查询的模型架构,该架构同时处理横向和纵向规划行为,实现了灵活、多样化的驾驶行为;

2)本文提出了一种新型的基于微分插值的辅助损失计算方法。该方法适用于广泛的辅助任务,并且允许在基于向量的模型中进行高效批量计算;

3)本文提出对比模仿学习(CIL)框架,并且提供了一组新的数据增强。CIL框架旨在调整驾驶行为和增强交互学习,而不会显著增加训练的复杂性;

4)本文对大规模nuPlan数据集的评估表明,PLUTO在闭环规划中实现了最先进的性能。本文所提出的模型和基准是开源的。

论文图片和表格

总结

本项研究引入了PLUTO,这是一种开创性的数据驱动规划框架,它扩展了自动驾驶领域中模仿学习的能力。本文提出了关于模型架构、数据增强和学习框架的创新解决方案,其有效地解决了模仿学习中的长期挑战。基于查询的模型架构为规划器提供了在纵向和横向维度上自适应驾驶行为的能力。本文基于微分插值的计算辅助损失的新方法为将约束集成到模型中提供了一种新方法。此外,本文采用一种对比模仿学习框架以及先进的数据增强技术,以增强所需行为的获取和内在交互的理解。本文利用现实世界驾驶数据集进行实验评估,结果表明,本文方法为该领域的闭环性能建立了新的基准。值得注意的是,PLUTO超越了先前表现最好的基于规则的规划器,在自动驾驶研究方面取得了重大突破。

局限性和未来工作:本文方法预测了每个动态智能体的单条轨迹。该方法在实际应用中获得了令人满意的结果;然而,生成有意义的联合多模态预测并且将其高效地加入规划策略是未来研究的重要领域。增加后处理模块已被证明能够有效地提高整体性能。但是,它无法处理所有生成轨迹均不可用的情况。将后处理的功能转变为直接影响轨迹生成的中间角色可能是一种更有利的策略。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注


往期评论