本发明涉及车辆关键特性精准控制领域,尤其涉及一种面向adas测试场景的车辆关键特性精准控制方法与系统。
背景技术:
1、高级驾驶辅助系统(advanced driver assistance systems, adas)作为现代汽车工业的重要发展方向,正在快速普及和发展。adas技术旨在提高驾驶安全性、舒适性和效率,包括自适应巡航控制(acc)、自动紧急制动(aeb)、车道保持辅助(lka)等多种功能。随着adas技术的不断进步和复杂化,其测试验证工作变得越来越具有挑战性。adas测试场景通常涉及多个车辆的协同运动,需要精确控制测试车辆的速度、位置、加速度等关键特性,以模拟各种复杂的交通情况。例如,在aeb测试中,需要精确控制目标车辆的运动轨迹和速度变化,以评估被测车辆的制动性能。在这些测试中,车辆关键特性的控制精度直接影响测试结果的准确性和可靠性。传统的车辆控制方法主要依赖于人工驾驶或简单的自动控制系统,难以满足adas测试对精度和一致性的高要求。此外,随着adas功能的增多和复杂化,测试场景也变得更加多样和复杂,这进一步增加了车辆控制的难度。
技术实现思路
1、有鉴于此,本发明提供一种面向adas测试场景的车辆关键特性精准控制方法,以适应各种复杂的测试场景,实现对车辆速度、方向等关键参数的高精度、实时控制,以支持adas功能的全面测试和验证。
2、为实现上述目的,本发明提供的一种面向adas测试场景的车辆关键特性精准控制方法,包括以下步骤:
3、s1:构建测试场景的状态空间和动作空间,其中状态空间依据车辆周围的环境状态进行向量表示,动作空间依据车辆的关键特性控制参数进行向量表示;
4、s2:基于构建的状态空间和动作空间采集不同测试场景下的轨迹操作数据并进行向量表示,形成测试轨迹操作数据序列,根据测试轨迹操作数据序列进行偏好学习,得到不同测试场景下的轨迹操作奖励函数;
5、s3:基于学习到的轨迹操作奖励函数、状态空间以及动作空间构建测试场景车辆关键特性精确控制模型,所述测试场景车辆关键特性精确控制模型以测试场景状态为输入,以车辆关键特性控制参数为输出;
6、s4:对构建的测试场景车辆关键特性精确控制模型进行优化求解,并利用优化求解得到的模型进行测试场景车辆关键特性精准控制。
7、作为本发明的进一步改进方法:
8、可选地,所述s1步骤中构建测试场景的状态空间和动作空间,包括:
9、构建测试场景的状态空间和动作空间,其中状态空间依据车辆周围的环境状态进行向量表示,动作空间依据车辆的关键特性控制参数进行向量表示;
10、状态空间利用adas(advanced driving assistance system,高级驾驶辅助系统)中的传感器采集测试车辆周围的环境状态,其中测试车辆周围环境状态的表示形式为:
11、;
12、其中:
13、c表示测试车辆周围环境状态的表示形式;
14、表示测试车辆自身位置;
15、表示测试车辆周围8个方向区域的环境状态,其中每个方向区域的环境状态包括方向区域的位置、是否存在车辆、是否存在障碍物、车辆横向速度、车辆纵向速度以及车辆朝向;
16、并采用独热编码方式对测试车辆周围环境状态进行编码,得到测试车辆周围环境状态向量;
17、动作空间获取测试车辆自身的横向速度、车辆纵向速度以及车辆加速度作为测试车辆的关键特性控制参数,并采用独热编码方式对关键特性控制参数进行编码,得到关键特性控制参数向量。在本发明实施例中,动作空间包含了测试车辆的所有关键特性控制参数。
18、可选地,所述s2步骤中基于构建的状态空间和动作空间采集不同测试场景下的轨迹操作数据并进行向量表示,形成测试轨迹操作数据序列,包括:
19、基于构建的状态空间和动作空间采集测试车辆在不同测试场景下的轨迹操作数据并进行向量表示,形成测试轨迹操作数据序列,其中所采集轨迹操作数据序列l的表示形式为:
20、;
21、;
22、其中:
23、表示第n个测试场景下轨迹操作数据的向量表示结果;
24、表示第n个测试场景下m个连续路段的操作数据的向量表示结果,表示第m个连续路段的操作数据的向量表示结果,表示第m个连续路段中测试车辆自身位置的向量表示结果,表示第m个连续路段中测试车辆周围8个方向区域的环境状态的向量表示结果,表示第m个连续路段中测试车辆的关键特性控制参数的向量表示结果;
25、根据测试轨迹操作数据序列进行偏好学习,得到不同测试场景下的轨迹操作奖励函数。
26、可选地,所述根据测试轨迹操作数据序列进行偏好学习,得到不同测试场景下的轨迹操作奖励函数,包括:
27、根据测试轨迹操作数据序列进行偏好学习,并构建得到不同测试场景下的轨迹操作奖励函数,其中不同测试场景下轨迹操作奖励函数的构建流程为:
28、s21:初始化生成轨迹操作奖励基函数:
29、;
30、;
31、;
32、其中:
33、表示轨迹操作奖励基函数,依次表示测试车辆与前车状态差距、测试车辆安全性以及测试车辆舒适性,s表示测试车辆的关键特性控制参数调整结果;
34、表示当前环境状态下测试车辆距离周围车辆的最近距离,表示按照关键特性控制参数调整结果s对测试车辆进行调整后,测试车辆距离周围车辆的最近距离;
35、表示当前环境状态下测试车辆的前车纵向速度,表示按照关键特性控制参数调整结果s对测试车辆进行调整后,测试车辆的车辆纵向速度;
36、表示最小车距阈值;
37、表示按照关键特性控制参数调整结果s对测试车辆进行调整后,测试车辆的车辆加速度变化值;
38、表示以自然常数为底的指数函数;
39、s22:获取不同测试场景下的轨迹操作数据,并计算得到不同测试场景之间的偏好性;
40、s23:将偏好性作为不同测试场景之间的距离,采用kmeans算法对n个测试场景进行聚类,得到测试场景的k个测试场景簇,其中每个测试场景簇中包含若干个测试场景以及测试场景对应的轨迹操作数据向量,轨迹操作数据向量为轨迹操作数据的向量表示结果;
41、s24:计算得到每个测试场景簇的轨迹操作奖励函数,其中第k个测试场景簇的轨迹操作奖励函数为:
42、;
43、;
44、;
45、;
46、其中:
47、表示第k个测试场景簇的轨迹操作奖励函数,;
48、依次表示第k个测试场景簇中所有轨迹操作数据向量的车距均值、车速均值以及加速度均值,其中车距均值表示m个路段中测试车辆与周围车辆的最近距离的均值,车速均值均值表示m个路段中测试车辆与前车的纵向速度之差的均值,加速度均值表示测试车辆在m个连续路段的加速度均值;
49、依次表示第k个测试场景簇中所有轨迹操作数据向量的车距标准差、车速标准差以及加速度标准差;
50、表示第k个测试场景簇中三个轨迹操作奖励基函数的权重值。
51、可选地,所述s22步骤中获取不同测试场景下的轨迹操作数据,并计算得到不同测试场景之间的偏好性,包括:
52、其中第n个测试场景与第个测试场景之间的偏好性为:
53、;
54、;
55、其中:
56、表示第n个测试场景与第个测试场景之间的偏好性,,;
57、表示向量与向量之间的相似度,表示l2范数。
58、可选地,所述s3步骤中基于学习到的轨迹操作奖励函数、状态空间以及动作空间构建测试场景车辆关键特性精确控制模型,包括:
59、基于学习到的轨迹操作奖励函数、状态空间以及动作空间构建测试场景车辆关键特性精确控制模型,所述测试场景车辆关键特性精确控制模型以测试场景状态为输入,以车辆关键特性控制参数为输出,其中改进的深度q网络为构建测试场景车辆关键特性精确控制模型的实施方法,测试场景车辆关键特性精确控制模型包括输入层、在线网络参数提取层、状态映射层以及输出层;
60、输入层用于接收测试场景状态,其中测试场景状态为测试车辆的当前测试车辆周围环境状态;
61、在线网络参数提取层用于提取部署在线上的网络参数,并基于网络参数构建得到神经网络;
62、状态映射层用于利用所构建的神经网络对测试场景状态进行映射,得到测试车辆的当前车辆关键特性控制参数,作为输出层的输出结果。
63、可选地,所述s4步骤中对构建的测试场景车辆关键特性精确控制模型进行优化求解,包括:
64、对构建的测试场景车辆关键特性精确控制模型进行优化求解,其中优化求解流程为:
65、s41:获取动作空间,并初始化生成模型参数;
66、s42:设置模型参数的当前迭代次数为t,最大迭代次数为max,t的初始值为0,则模型参数的第t次迭代结果为;
67、s43:选取前t个测试场景的轨迹操作数据向量,并从中提取环境状态向量以及关键特性控制参数向量,其中环境状态向量为测试车辆在不同路段的周围环境状态的向量表示,关键特性控制参数向量为测试车辆在不同路段的关键特性控制参数的向量表示;
68、s44:对于任意路段的环境状态向量,利用模型参数计算得到动作空间中不同关键特性控制参数向量对于该环境状态向量的q值,选取q值最大的关键特性控制参数向量作为输出结果,并计算该关键特性控制参数向量的轨迹操作奖励函数值;
69、s45:构建得到轨迹操作奖励函数值的均方差损失函数:
70、;
71、其中:
72、表示均方差损失函数;
73、t表示转置;
74、表示所选取第个测试场景的第m个路段所对应环境特征向量;
75、表示环境特征向量所对应的q值最大的关键特性控制参数向量;
76、表示l1范数;
77、即为对于环境特征向量的q值,b表示调控系数,将设置为0.2;
78、s46:结合均方差损失函数,采用梯度下降方式对模型参数进行迭代更新,得到;
79、s47:令t=t+1,返回步骤s44,直到达到最大迭代次数,得到最优参数,将网络参数部署到线上。
80、可选地,所述s46步骤中结合均方差损失函数,采用梯度下降方式对模型参数进行迭代更新,包括:
81、s461:计算第t次迭代时均方差损失函数的梯度:
82、;
83、其中:
84、表示梯度算子;在本发明实施例中,的计算方式为以模型参数为变量对均方差损失函数进行求导,并将模型参数代入求导结果;
85、s462:计算得到移动平均指数:
86、;
87、其中:
88、表示指数衰减率,将设置为0.91;在本发明实施例中,;
89、s463:对模型参数进行迭代:
90、;
91、其中:
92、表示学习率,将学习率设置为0.01。
93、可选地,所述利用优化求解得到的模型进行测试场景车辆关键特性精准控制,包括:
94、利用优化求解得到的模型进行测试场景车辆关键特性精准控制,其中测试场景车辆关键特性精准控制流程为:
95、输入层接收测试车辆的测试场景状态s;
96、在线网络参数提取层提取部署在线上的网络参数,并基于网络参数构建得到神经网络,其中所构建的神经网络包括卷积层以及全连接层,网络参数中包含卷积层的权重矩阵以及全连接层的映射矩阵,;
97、状态映射层利用所构建的神经网络对测试场景状态s进行映射,得到测试车辆的当前车辆关键特性控制参数a,作为输出层的输出结果:
98、;
99、其中:
100、t表示转置;
101、表示独热编码的逆编码,将关键特性控制参数向量转换为关键特性控制参数,实现利用adas采集环境状态,并生成保证车辆安全性、舒适性以及减少与前车距离关联、速度关联的关键特性控制参数。
102、为了解决上述问题,本发明提供一种面向adas测试场景的车辆关键特性精准控制系统,其特征在于,所述系统包括:
103、测试数据采集模块,用于构建测试场景的状态空间和动作空间,基于构建的状态空间和动作空间采集不同测试场景下的轨迹操作数据并进行向量表示,形成测试轨迹操作数据序列;
104、函数生成模块,用于根据测试轨迹操作数据序列进行偏好学习,得到不同测试场景下的轨迹操作奖励函数;
105、车辆控制装置,用于基于学习到的轨迹操作奖励函数、状态空间以及动作空间构建测试场景车辆关键特性精确控制模型,对构建的测试场景车辆关键特性精确控制模型进行优化求解,并利用优化求解得到的模型进行测试场景车辆关键特性精准控制。
106、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
107、存储器,存储至少一个指令;
108、通信接口,实现电子设备通信;及
109、处理器,执行所述存储器中存储的指令以实现上述所述的面向adas测试场景的车辆关键特性精准控制方法。
110、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的面向adas测试场景的车辆关键特性精准控制方法。
111、相对于现有技术,本发明提出一种面向adas测试场景的车辆关键特性精准控制方法,该技术具有以下优势:
112、首先,本方案提出一种结合场景特性的奖励函数构建方式,利用adas采集不同场景下环境状态信息以及关键特性控制参数信息构成状态空间以及动作空间,并对不同测试场景进行偏好性计算以及聚类处理,根据聚类结果中不同测试场景对驾驶安全性、舒适性以及与前车的关联程度,生成不同测试场景下的轨迹操作奖励函数,实现基于场景特性的车辆特性调整,在不同驾驶场景下侧重不同驾驶体验;
113、同时,本方案基于轨迹操作奖励函数对测试场景车辆关键特性精确控制模型中的模型参数优化效果进行量化,并通过对训练数据数目进行迭代,对模型参数进行同步迭代,利用优化求解得到的模型接收adas所采集的测试场景状态,并利用模型参数进行映射,生成保证车辆安全性、舒适性以及减少与前车距离关联、速度关联的关键特性控制参数。
1.一种面向adas测试场景的车辆关键特性精准控制方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种面向adas测试场景的车辆关键特性精准控制方法,其特征在于,所述s1步骤中构建测试场景的状态空间和动作空间,包括:
3.如权利要求2所述的一种面向adas测试场景的车辆关键特性精准控制方法,其特征在于,所述s2步骤中基于构建的状态空间和动作空间采集不同测试场景下的轨迹操作数据并进行向量表示,形成测试轨迹操作数据序列,包括:
4.如权利要求3所述的一种面向adas测试场景的车辆关键特性精准控制方法,其特征在于,所述根据测试轨迹操作数据序列进行偏好学习,得到不同测试场景下的轨迹操作奖励函数,包括:
5.如权利要求1所述的一种面向adas测试场景的车辆关键特性精准控制方法,其特征在于,所述s3步骤中基于学习到的轨迹操作奖励函数、状态空间以及动作空间构建测试场景车辆关键特性精确控制模型,包括:
6.如权利要求5所述的一种面向adas测试场景的车辆关键特性精准控制方法,其特征在于,所述s4步骤中对构建的测试场景车辆关键特性精确控制模型进行优化求解,包括:
7.如权利要求6所述的一种面向adas测试场景的车辆关键特性精准控制方法,其特征在于,所述s46步骤中结合均方差损失函数,采用梯度下降方式对模型参数进行迭代更新,包括:
8.如权利要求1所述的一种面向adas测试场景的车辆关键特性精准控制方法,其特征在于,所述利用优化求解得到的模型进行测试场景车辆关键特性精准控制,包括:
9.一种面向adas测试场景的车辆关键特性精准控制系统,其特征在于,所述系统包括: