原文链接:https://mp.weixin.qq.com/s/YxjNCAmc5aAjjy9FqUFmpQ
论文链接:https://arxiv.org/pdf/2505.13872
摘要
本文介绍了Safety2Drive:用于自动驾驶评估的安全关键场景基准。自动驾驶(AD)系统需要高水平的安全保障。尽管AD在Longest6和Bench2Drive等开源基准上取得了重大进展,但是现有的数据集仍然缺乏符合监管的场景库来进行闭环测试,以全面评估AD的功能安全性。同时,现实世界AD事故通常发生在长尾边缘场景(即安全关键场景)中,这些场景在当前的驾驶数据集中代表性不足。这种稀缺性导致不足以评估AD性能,从而给安全性验证和实际部署带来风险。为了应对这些挑战,本文提出了Safety2Drive,这是一种旨在评估AD系统的安全关键场景库。Safety2Drive提供了三个关键贡献:(1)Safety2Drive全面涵盖了标准监管所要求的测试项目,并且包含了70个AD功能测试项目;(2)Safety2Drive支持安全关键场景泛化,它能够注入安全威胁,例如自然环境破坏和对抗性攻击;(3)Safety2Drive支持多维度评估。除了评估AD系统外,它还支持评估各种感知任务,例如目标检测和车道检测。Safety2Drive提供了由场景构建到验证的范式,为AD的安全部署建立了一个标准化的测试框架。
主要贡献
本文的贡献总结如下:
1)全面的标准监管功能测试范围。Safety2Drive包含70个功能测试项目。据作者所知,除了在现实世界中部署标准监管场景外,目前闭环仿真环境中还没有符合标准监管要求的开源场景库;
2)安全关键场景泛化。Safety2Drive支持场景泛化,允许将每个功能测试项目扩展到各种安全关键场景中。具体而言,它支持注入安全威胁(例如自然环境破坏和对抗性攻击),这可用于评估AD的鲁棒性和安全性;
3)从感知到系统的评估过程。Safety2Drive不仅支持智能感知算法的评估,还支持各种AD系统的评估,从而实现了一个统一的组件到系统的评估框架。
论文图片和表格











总结
为了解决目前缺乏用于评估闭环仿真中标准法规要求的自动驾驶功能安全的场景库问题,本文提出了一种安全关键基准Safety2Drive。为此,本文构建了一个自动驾驶验证框架,它包括场景构建、场景泛化和场景评估。场景构建模块包括70个人工设计的功能测试项目,它们符合标准监管要求。场景泛化功能模块能够将安全关键风险注入功能测试项目中,以评估自动驾驶系统的安全性和鲁棒性。这些安全关键风险包含自然环境破坏和对抗性攻击。场景评估模块不仅支持智能感知任务的评估,还支持各种自动驾驶系统的评估。

发表回复