2025-09-17 浙大S-BEVLoc | 抛掉真值!LiDAR定位实现“零成本”自监督的SOTA新突破

原文链接:https://mp.weixin.qq.com/s/MhnsuDpf25IOAG1bTKth3g

无需真值的大规模自监督重定位

全局定位负责回环检测与重定位,是消除里程计漂移、恢复跟踪失败的关键。

现有监督方法分两阶段:

  • 先全局检索,再局部位姿估计,整个流程均需位姿真值。训练时,通过位置阈值划分正/负样本,以学习区分性全局描述子;
  • 局部位姿估计阶段则依赖真值对应点提升特征可重复性。然而,获取高精度真值需昂贵且繁琐的传感器标定、同步与插值,严重限制算法在大规模场景中的扩展。

S-BEVLoc 首次实现完全自监督的 LiDAR 全局定位,核心观察:单张 BEV 图像内部不同区域的地理距离已知,可直接构造”困难三元组”用于训练。

文章标题:S-BEVLoc: BEV-based Self-supervised Framework for Large-scale LiDAR Global Localization

具体贡献

  1. 提出 S-BEVLoc,无需位姿真值,输入单帧 LiDAR 扫描即可完成自监督训练。
  2. 设计单图三元组生成策略,结合 SoftCos 损失,增强全局描述子区分度。
  3. 在 KITTI、NCLT 等大规模、长周期数据集上验证,性能媲美甚至超越监督方法,且扩展性极强。

具体方法

训练阶段仅输入单帧 LiDAR 扫描,投影为 BEV 图像后,通过三元组生成模块获得训练样本;CNN-REM 作为特征提取器,输出旋转等变局部特征;NetVLAD 聚合全局描述子,用 SoftCos 损失监督。推理阶段先全局检索,再局部匹配估计相对位姿,得到全局位姿。

单图三元组生成

实验验证:训练前,阈值附近负样本与查询描述子距离小于正样本,造成混淆;训练后,负样本距离明显增大,混淆消除。

SoftCos 损失

全局定位推理

实验结果

回环闭合

KITTI 与 NCLT 各序列,S-BEVLoc 在 AP、F1、R% 上与监督方法相当;S-BEVLoc* 因额外无真值数据训练,表现更佳。PR 曲线显示自监督与监督曲线几乎重合。

全局定位

NCLT 挑战序列上,S-BEVLoc 在召回、SR、误差指标均优于 BEVPlace++ 等监督方法;S-BEVLoc* 通过无真值数据继续提升,验证”数据越多,性能越好”的扩展优势。

运行时间

RTX 2080Ti + i5-12600KF 上,单次全局定位:
描述子提取 23.2 ms(11.6 ms×2) + 检索 0.12 ms + 位姿估计 15.5 ms ≈ 38.8 ms,频率 > 20 Hz,满足 10 Hz LiDAR 实时需求。

总结一下

本文提出 S-BEVLoc,首个完全自监督的 LiDAR 全局定位框架:

  • 训练阶段无需位姿真值,单帧 LiDAR 通过单图三元组与 SoftCos 损失即可完成自监督学习;
  • 推理阶段保持”先检索-再匹配”流水线,实时运行;
  • 在大规模、长周期、跨场景数据集上达到与监督方法相当甚至更优的性能,并具备极强扩展性。
    未来工作将探索更鲁棒的表示与网络架构,以应对坡度、极端天气等挑战。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注


往期评论