2024-08-08 【上海交通大学】ParkingE2E:基于相机的端到端泊车网络

论文链接:https://arxiv.org/pdf/2408.02061

项目主页:https://github.com/qintonguav/ParkingE2E

摘要

本文介绍了ParkingE2E:基于相机的端到端泊车网络。自动泊车是智能驾驶领域中的一项关键任务。传统的泊车算法通常使用基于规则的方案来实现。然而,由于算法的复杂设计,这些方法在复杂的泊车场景中效果较差。相比之下,基于神经网络的方法往往比基于规则的方法更直观、更通用。通过采集大量专家泊车轨迹数据并且通过基于学习的方法模拟人类策略,可以有效地完成泊车任务。本文采用模仿学习来执行从RGB图像到路径规划的端到端规划,其模仿人类驾驶轨迹。本文所提出的端到端方法利用了目标查询编码器来融合图像和目标特征,并且使用基于transformer的解码器来自回归预测未来的路径点。本文在现实世界场景中进行广泛的实验,结果表明,所提出的方法在四个不同的现实世界车库中实现了87.8%的平均泊车成功率。实车实验进一步验证了本文所提出方法的可行性和有效性。

主要贡献

本文的贡献总结如下:

1)本文设计了一个端到端网络来执行泊车任务。该网络将环视图像转换为鸟瞰图(BEV)表示,并且通过采用目标特征查询图像特征,将其与目标停车位的特征融合。由于轨迹点的顺序性,本文利用一种基于transformer解码器的自回归方法来生成轨迹点;

2)本文在实车上部署了端到端模型进行测试,并且验证了该网络模型在各种现实世界场景中泊车的可行性和泛化能力,为端到端网络部署提供了有效的解决方案。

论文图片和表格

总结

本文提出了一种基于相机的端到端泊车模型。该模型输入目标车位和环视RGB图像,通过目标查询获得BEV视图中的融合特征,并且使用transformer解码器以自回归的方式预测轨迹点。轨迹规划的结果随后用于控制。本文在各种场景下广泛评估了所提出的方法,结果证明了其可靠性和泛化能力。然而,本文的端到端方法和高度优化的基于规则的泊车方法之间仍然存在性能差距。今后的工作旨在进一步提升端到端泊车算法的性能,期望基于学习的方法最终会超越传统的方法。本文相信,本项研究和实践将激励并且激发其他研究者和工程师的思考。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注


往期评论