自动驾驶 | arxiv daily|PPGeo:自动驾驶自监督预训练框架

发布于 2023-01-06 11:55・IP 属地江苏

POLICY PRE-TRAINING FOR AUTONOMOUS DRIVING VIA SELF-SUPERVISED GEOMETRIC MODELING

提交时间:2023年1月1日

论文 :https://arxiv.org/pdf/2301.01006.pdf

代码:https://github.com/OpenDriveLab/PPGeo

摘要:

cv和nlp领域大规模数据预训练技术取得的令人瞩目的成就,目前基于视觉的自动驾驶任务本质上缺乏视图和平移不变性,并且视觉输入包含大量与决策无关的信息,导致一般视觉的主要预训练方法不太适合自动驾驶任务。

PPGeo(通过几何建模进行策略预训练),这是一种直观且直接的完全自监督框架,专为视觉运动驾驶中的策略预训练而设计。通过大规模未标记的YouTube驾驶视频上建模 。

PPGeo 分两个阶段执行,以支持有效的自我监督培训。

第一阶段,几何建模框架以两个连续帧作为输入同时生成姿势和深度预测。

第二阶段,视觉编码器通过优化预测未来运动和当前的误差来学习驾驶。因此,预训练的视觉编码器包含丰富的驾驶策略相关表示,从而能够胜任多项视觉运动驾驶任务。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注


往期评论