2024-08-22 面向自动驾驶仿真测试的高覆盖切入场景库生成方法

为解决虚拟仿真测试所需高覆盖场景的生成难题，本文以自动驾驶车辆事故高发的高速公路切入场景为研究对象，提出一种面向自动驾驶仿真测试的切入场景轨迹模型与高覆盖场景生成方法，为自动驾驶虚拟仿真测试提供有力支撑。本文提出的高覆盖切入场景库生成方法：首先，选取核心场景要素建立基于运动学特征的车辆切入轨迹模型，量化分析模型参数分布特征；其次，基于高斯混合模型(Gaussian Mixture Model, GMM)构建多维度逻辑场景参数联合概率密度函数；最后，提出基于哈密尔顿蒙特卡洛(Hamiltonian Monte Carlo, HMC)采样与Jensen-Shannon(JS)散度覆盖度表征的多维空间场景参数高覆盖生成方法。

图 1 高覆盖切入场景库生成方法总体流程图

基于所提取的车辆切入数据研究发现：(1)基于起始时刻主车速度V_e0、相对速度V_r0、车距D_x0、切入时长T、切入车辆横向加速度a_y和纵向加速度a_x六参数的横纵向运动学模型可有效表征切入车辆运动轨迹，平均拟合均方根误差为0.7 m；(2) 八分量高斯混合模型对切入场景参数的联合概率密度分布拟合效果最佳；(3) JS散度随着场景采样数量的增加快速下降而后逐渐收敛至0.01，即覆盖度为99%，表明HMC方法可实现切入场景参数的快速采样与高覆盖生成；(4) 本方法实现切入数据集片段信息全覆盖所需场景生成数量为2160个，相比于传统马尔科夫蒙特卡洛(Markov Chain Monte Carlo, MCMC)方法所需场景生成量缩小约73倍，测试效率显著提高，推荐用于高速公路全量切入场景库构建。

1 研究背景

自动驾驶处于L2级向L3级突破的关键阶段，政策法规、用户需求、技术研发等推动高等级自动驾驶车辆产业化落地。仿真测试因其高效率、低成本特点，已成为自动驾驶测试验证中必不可少的一环。

图 2 自动驾驶安全性测试需求和测试方式

在自动驾驶算法仿真开发与测试中，本地化、参数化、高覆盖的虚拟场景生成技术是核心。当前研究中的仿真测试切入轨迹模型存在可解释性差、精度与生成效率不兼容的问题，且缺乏面向准入监管的高精度、高覆盖、高效率切入场景生成方法。因此，本文以中国道路自然驾驶数据为基础，研究面向自动驾驶仿真测试的本地化、高覆盖、高效率高速公路切入场景生成方法,形成高速公路切入场景库，应用于自动驾驶仿真测试。

2 模型方法

2.1 基于车辆运动学的切入轨迹模型

选取切入初始时刻主车速度、两车相对速度、车距以及表征切入过程的切入时长、纵向加速度、横向加速度六参数构建基于车辆运动学的切入轨迹模型。

图 3 基于车辆运动学的切入轨迹模型

该运动学模型将切入车辆轨迹横、纵向解耦，道路行驶方向定义为纵向，用x来表示，与之垂直的方向定义为横向，用y来表示。切入车辆横向运动假设如下：

图 4 切入车辆横向运动示意图

基于以上假设，本文提出的车辆运动学模型为：

基于真实道路切入轨迹数据对提出的车辆运动学切入轨迹模型进行参数标定，计算真实轨迹与生成轨迹曲线的横向和纵向平均均方根误差分别为0.33 m与0.54 m，综合平均均方根误差为0.7 m。

2.2 基于GMM的切入逻辑场景构建方法

真实道路自然驾驶数据受众多因素影响，参数多呈多峰、偏态分布。因此本文采用GMM进行切入场景参数拟合，以满足参数分布特征。对比发现八高斯分量模型拟合效果最后，则本文六逻辑场景参数的联合概率密度函数为：

计算切入逻辑场景六参数的联合概率分布：

图 5 联合概率密度

2.3 基于HMC的场景参数采样方法

传统MCMC是一种用于从概率分布中采样的方法，通过构造特定的马尔科夫链，随机游走逼近目标分布，在解决高维空间问题上具有显著优势，但存在效率低下问题。基于哈密尔顿动力学的HMC采样方法是一种改进的MCMC算法，HMC利用目标分布的梯度信息更快地向高概率区域移动，避免随机游走，可以更高效地收敛到目标分布。本文首次提出采用HMC对场景参数采样，实现仿真测试场景参数的高效率、高覆盖生成。具体而言，HMC利用 t 时刻采样点的位置和速度描述场景采样运动过程，采样点位置和速度分别对应当前采样点势能和动能。利用哈密尔顿动力学计算采样点下一时刻状态，其中采样点的势能与动能则组成采样系统总能量：

式中：H(·)是哈密尔顿函数；U(x)为某一采样点处的势能；K(p)为动能。由能量守恒可知，没有外力干扰下，H (x, p)不变，即恒为常量。

若采样点落在切入场景联合概率分布函数的高概率区域，则势能增大、动能减小，采样点会以较小的步幅在高概率区域移动；若采样点落在低概率区域，势能减小、动能增大，采样点会快速回概率较高的区域，实现以较少的采样数快速收敛至切入场景联合概率分布函数。结合物理学中势能与动能公式推导出哈密尔顿动力学的偏微分方程为：

为了求解哈密尔顿方程，采用Leapfrog方法将连续的哈密尔顿系统离散化。具体方法如下：

其中，势能函数U(x)为目标分布的负对数似然函数：

随后采用Metropolis-Hasting方法决定是否接受或拒绝所提议的样本。采样接受率为：

2.4 基于JS散度的场景参数覆盖度

场景覆盖度本质上是所生成场景参数对真实道路场景参数的覆盖度，即两类参数分布相似度。本文提出采用JS散度量化采样的场景参数分布对真实数据分布的覆盖度，JS 散度越小，信息损耗越低，覆盖度越高。对于两个概率分布P 和Q，JS散度计算公式如下：

JS散度范围为[0, 1]，其对概率分布之间的相似性量化如下：

🔶如果JS散度接近0，表明采样分布非常接近原始数据分布，采样分布对真实分布覆盖度高；

🔶 如果JS散度接近1，表示采样分布与真实分布差异较大、覆盖较低，还需要更多采样场景才能满足覆盖度要求；

🔶 如果JS散度趋于稳定，意味着再增加采样场景数将不会提供更多有效场景。

3 研究结果

3.1 HMC与传统MCMC采样结果对比

传统MCMC与本文提出的HMC方法各采样1000次后的概率密度函数图如下：

图 6 采样1000次时MCMC与HMC参数分布对比

可观察到，HMC生成的场景参数分布与原始数据分布较为一致，而MCMC生成的场景参数与原始数据分布存在较大差异。该结果表明本文提出的HMC方法在场景生成效率和对原始数据分布的覆盖度上均表现更为优越，相较于传统MCMC方法具有更高的性能。如下所示为随机抽取生成的场景参数输入切入轨迹模型中生成具体切入场景。

3.2 HMC最佳采样数确定

进一步探究切入场景数量与原始数据覆盖度之间的关系，以确定切入场景库中应涵盖的最佳场景数量。采用JS散度作为覆盖度度量标准，评估不同采样数对原始数据承载信息的覆盖程度，并将所提出的HMC采样方法与传统的MCMC采样方法进行对比。

图 7 采样分布与目标分布的JS散度

随着场景采样数量的增加，2种方法的JS散度均快速下降，覆盖度逐步提升。当HMC的采样数量增加至30000后，有效样本数量稳定于2160，基本达到收敛状态，此时JS散度为0.01，此时采样分布与原始分布几乎完全重合（图8）。图9为所生成2160例场景的切入车辆轨迹图。

图 8 最佳采样数分布与原始数据分布对比

图 9 HMC采样场景参数生成轨迹

综上所述，HMC采样所得的2160例场景相比于传统MCMC测试场景数减少约73倍，极大提高了场景测试的效率，实现本文所采集高速切入场景数据信息的全覆盖，推荐用于构建高速公路全量切入场景库。

总结展望

面向自动驾驶仿真测试对本地化、可解释性、高覆盖场景需求，本文基于真实道路自然驾驶数据对高速公路切入场景进行研究，提出了切入车辆轨迹生成模型与高覆盖场景生成方法，构建了高速切入全量场景库，具有参数化可扩展、物理含义明确、计算便利、场景生成快捷、覆盖度高等特征，可应用于自动驾驶仿真测试，供虚拟切入场景的快速与大批量生成。后续研究一方面可以进一步扩充边缘场景数量，探究数据规模与覆盖范围对结果的影响；另一方面可以考虑加入更多场景因素优化切入轨迹模型，提高精度。

2024-08-22 面向自动驾驶仿真测试的高覆盖切入场景库生成方法

发表回复取消回复

Categories

Archives

2024-08-22 面向自动驾驶仿真测试的高覆盖切入场景库生成方法

发表回复 取消回复

Categories

Archives

发表回复取消回复