
- 论文链接:https://arxiv.org/pdf/2406.08481
- 代码链接:https://github.com/BraveGroup/LAW
摘要
本文介绍了通过隐式世界模型增强端到端自动驾驶。端到端自动驾驶已经引起了广泛关注。当前的端到端方法在很大程度上依赖于感知任务的监督,例如检测、跟踪和地图分割,以辅助学习场景表示。然而,这些方法需要大量标注,这阻碍了数据的可扩展性。为了应对这一挑战,本文提出了一种新的自监督方法来增强端到端驾驶,而无需昂贵的标注成本。具体而言,本文框架LAW使用一种隐式世界模型,其基于预测的自车行为和当前帧的隐式特征来预测未来的隐式特征。该预测的隐式特征由未来实际观测到的特征来监督。该监督联合优化了隐式特征学习和行为预测,这大大提升了驾驶性能。因此,本文方法在开环和闭环基准上均实现了最先进的性能,而无需成本高昂的标注。
主要贡献
本文的主要贡献总结如下:
1)本文提出了一种用于自监督学习的隐式世界模型,其增强了端到端自动驾驶框架的训练;
2)基于潜在的世界模型,本文进一步提出了一种视图选择策略,该策略大大加快了流程的运行速度,同时使性能损失最小;
3)本文框架LAW在开环基准和闭环基准上均实现了最先进的结果,而无需人工标注。
论文图片和表格










总结
本文引入了一种新的使用隐式世界模型的自监督方法。该方法增强了端到端自动驾驶系统中场景表示的学习,而无需成本高昂的标注。尽管本文方法在当前基准上展现出具有前景的结果,但是它仍然受到所用数据量有限的限制。在今后的工作中,本文旨在通过将所提出方法应用于更大、更多样化的数据集来增强其可扩展性。本文利用大规模数据来尝试采用隐式世界模型进行预训练。

发表回复