轨迹预测模型的训练方法、车辆轨迹的预测方法及车辆与流程

    技术2025-07-16  23


    本公开涉及自动驾驶,特别涉及一种轨迹预测模型的训练方法、车辆轨迹的预测方法及车辆。


    背景技术:

    1、在高级别自动驾驶技术中,为了应对高度复杂动态的道路交通环境,系统要理解分析环境中车辆和行人等其他交通参与者的行驶意图和运动趋势,进而使得自动驾驶车辆能够安全无碰撞地行驶。为此,交通参与者的轨迹预测技术在自动驾驶系统的安全保障上方面发挥着核心作用,同时也为下游的决策规划模块提供主要的决策参考依据。

    2、为了表征交通参与者未来的多模态特性,轨迹预测算法有两种常用的多模态输出建模方式:一种是输出多条离散且同时附带概率的未来预测轨迹,概率表征了轨迹预测算法对所预测轨迹的置信度,所预测轨迹概率越高,表示模型越相信该轨迹符合未来真实情况。另一种是输出离散且同时附带高斯分布的未来预测轨迹,高斯分布的均值表征了不同可能轨迹的中心位置,而高斯分布方差则表征了预测轨迹的不确定性,即预测轨迹的可信范围。第一种建模方式最为广泛且简单直观,方便下游决策规划模块使用。

    3、在一个预测场景样本中,只有一个未来真实轨迹用于模型训练,即模型在一个样本中只能被单一模态的标签监督,而相比单模态标签,多模态标签可以提供样本场景下的意图不确定性信息。现有的基于学习的轨迹预测方案中,通常采用赢者通吃(winner-take-all,wta)策略训练模型能够进行多模态预测,只有最接近未来真实轨迹的预测轨迹用于计算误差,且训练该最优轨迹概率真值为1,其他轨迹概率真值为0。wta实现方式简单高效,也能够隐式地学习多模态轨迹标签信息。但该策略通常只关注了预测轨迹的运动准确性,忽略了预测轨迹的不确定性,会倾向让模型预测出的最接近真值的轨迹同时也获得过高的概率预测值,即预测的过度自信问题。但是模型预测的次优轨迹在很多情况下也是合理且可能发生的,在安全决策时也应该同等考虑,例如驾驶员在道路抢行时也会考虑到抢行失败后的及时避让措施。而在工程实践方面,一般只会下发高置信度的预测轨迹,低置信度的预测轨迹被忽略,特别是在预测过度自信的情况下,直接忽略低置信度的轨迹可能是一种错误的操作,从而进一步导致决策系统的失误。

    4、由于预测样本里面只有一个真值轨迹标签,而预测问题的建模一般采用最大似然估计,训练集中的轨迹模态分布直接影响模型的参数优化,采用wta策略依旧是在这种问题框架下拟和训练集中轨迹模态的分布,当训练集中的轨迹模态分布不均匀或者有缺失,也就会直接导致模型的性能受损或者表达能力不足。此外,使用wta策略的多模态轨迹分类损失采用硬阈值训练模型,不符合非最优轨迹有一定概率存在的特点,会增加模型学习的难度,也因此,大多数轨迹预测模型的分类损失无法收敛,虽然可以采用最大边界损失的计算方法缓解阈值过硬的问题,但依然存在单一模态置信度过高的问题。


    技术实现思路

    1、本公开要解决的技术问题是为了克服现有技术中存在单一模态置信度过高导致模态缺失的缺陷,提供一种车道标签的生成方法及装置、轨迹预测模型的训练方法及装置、车辆轨迹的预测方法及装置、电子设备、计算机可读存储介质、计算机程序产品以及自动驾驶车辆,提升了轨迹预测模型的多模态表现,同时也可以提高了轨迹预测的准确性。

    2、本公开是通过下述技术方案来解决上述技术问题:

    3、本公开的第一方面提供一种车道标签的生成方法,包括以下步骤:

    4、确定样本目标车辆当前所在的车道;

    5、根据道路网络沿着所述样本目标车辆当前所在的车道进行目标车道段的搜索;其中,所述道路网络中的每个车道被划分为多个车道段,所述目标车道段包括所述样本目标车辆可能经过的车道段;

    6、将搜索到的所述目标车道段的车道标签标注为正标签,以及其它车道段的车道标签标注为负标签。

    7、可选地,所述根据道路网络沿着所述样本目标车辆当前所在的车道进行目标车道段的搜索的步骤具体包括:

    8、根据道路网络和预设规则沿着所述样本目标车辆当前所在的车道进行目标车道段的搜索;

    9、其中,所述预设规则基于所述样本目标车辆的运动约束条件、所述样本目标车辆的可行驶空间约束条件和/或所述样本目标车辆的驾驶员的驾驶意图生成。

    10、可选地,所述目标车道段还包括与所述样本目标车辆可能经过的车道段相邻的同向车道段。

    11、可选地,每个车道被划分为多个长度相同的车道段。

    12、本公开的第二方面提供一种轨迹预测模型的训练方法,包括以下步骤:

    13、获取训练样本;其中,所述训练样本包括样本目标车辆的特征信息、所述样本目标车辆周围的环境信息、所述样本目标车辆的真实轨迹以及所有车道段的车道标签,所述车道标签利用第一方面所述的生成方法生成;

    14、将所述样本目标车辆的特征信息以及所述样本目标车辆周围的环境信息输入轨迹预测模型中进行轨迹预测,得到所述样本目标车辆的预测轨迹;

    15、根据所述预测轨迹和所述真实轨迹计算轨迹回归损失,以及根据所述预测轨迹和所有车道段的车道标签计算轨迹分类损失;

    16、根据所述轨迹回归损失和所述轨迹分类损失训练所述轨迹预测模型。

    17、可选地,所述根据所述预测轨迹和所有车道段的车道标签计算轨迹分类损失的步骤具体包括:

    18、响应于所述预测轨迹与正标签的车道段相匹配且所述预测轨迹的概率小于预设值,或者所述预测轨迹与正标签的车道段不匹配,确定所述正标签的车道段对应的轨迹损失;

    19、响应于所述预测轨迹与负标签的车道段相匹配且所述预测轨迹的概率大于等于所述预设值,确定所述负标签的车道段对应的轨迹损失;

    20、根据所有正标签的车道段对应的轨迹损失以及所有负标签的车道段对应的轨迹损失计算轨迹分类损失。

    21、可选地,所述训练方法还包括:

    22、根据所述预测轨迹与车道段之间的最短距离以及距离阈值确定所述预测轨迹与所述车道段之间的距离匹配度;

    23、根据目标轨迹在所述车道段上的投影长度以及所述目标轨迹的长度确定所述预测轨迹与所述车道段之间的方向匹配度,其中,所述目标轨迹为所述预测轨迹中与所述车道段之间的距离小于所述距离阈值的部分轨迹;

    24、根据所述距离匹配度和所述方向匹配度确定所述预测轨迹与所述车道段之间是否匹配。

    25、本公开的第三方面提供一种车辆轨迹的预测方法,包括以下步骤:

    26、获取目标车辆的特征信息以及所述目标车辆周围的环境信息;

    27、将所述目标车辆的特征信息以及所述目标车辆周围的环境信息输入轨迹预测模型中进行轨迹预测,得到所述目标车辆的预测轨迹;

    28、其中,所述轨迹预测模型利用第二方面所述的训练方法训练得到。

    29、本公开的第四方面提供一种车道标签的生成装置,包括:

    30、确定模块,用于确定样本目标车辆当前所在的车道;

    31、搜索模块,用于根据道路网络沿着所述样本目标车辆当前所在的车道进行目标车道段的搜索;其中,所述道路网络中的每个车道被划分为多个车道段,所述目标车道段包括所述样本目标车辆可能经过的车道段;

    32、标注模块,用于将搜索到的所述目标车道段的车道标签标注为正标签,以及其它车道段的车道标签标注为负标签。

    33、本公开的第五方面提供一种轨迹预测模型的训练装置,包括:

    34、样本获取模块,用于获取训练样本;其中,所述训练样本包括样本目标车辆的特征信息、所述样本目标车辆周围的环境信息、所述样本目标车辆的真实轨迹以及所有车道段的车道标签,所述车道标签利用第四方面所述的生成装置生成;

    35、信息输入模块,用于将所述样本目标车辆的特征信息以及所述样本目标车辆周围的环境信息输入轨迹预测模型中进行轨迹预测,得到所述样本目标车辆的预测轨迹;

    36、损失计算模块,用于根据所述预测轨迹和所述真实轨迹计算轨迹回归损失,以及根据所述预测轨迹和所有车道段的车道标签计算轨迹分类损失;

    37、模型训练模块,用于根据所述轨迹回归损失和所述轨迹分类损失训练所述轨迹预测模型。

    38、本公开的第六方面提供一种车辆轨迹的预测装置,包括:

    39、信息获取模块,用于获取目标车辆的特征信息以及所述目标车辆周围的环境信息;

    40、轨迹预测模块,用于将所述目标车辆的特征信息以及所述目标车辆周围的环境信息输入轨迹预测模型中进行轨迹预测,得到所述目标车辆的预测轨迹;

    41、其中,所述轨迹预测模型利用第五方面所述的训练装置训练得到。

    42、本公开的第七方面提供一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现第一方面所述的生成方法的步骤、第二方面所述的训练方法的步骤或者第三方面所述的预测方法的步骤。

    43、本公开的第八方面提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面所述的生成方法的步骤、第二方面所述的训练方法的步骤或者第三方面所述的预测方法的步骤。

    44、本公开的第九方面提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面所述的生成方法的步骤、第二方面所述的训练方法的步骤或者第三方面所述的预测方法的步骤。

    45、本公开的第十方面提供一种自动驾驶车辆,包括第七方面所述的电子设备。

    46、在符合本领域常识的基础上,上述各可选条件可任意组合,即得本公开各较佳实施例。

    47、本公开的积极进步效果在于:通过对样本目标车辆可能经过的车道段以及样本目标车辆不可能经过的车道段标注不同的车道标签,将其应用于轨迹预测模型的训练中可以指导其学习未来的多模态特性,允许非最佳匹配真值的轨迹存在一定的预测概率,从而避免单一模态过度自信而导致的模态缺失的问题,以提升轨迹预测模型的多模态表现,进而提高轨迹预测的准确性。


    技术特征:

    1.一种车道标签的生成方法,其特征在于,包括以下步骤:

    2.如权利要求1所述的生成方法,其特征在于,所述根据道路网络沿着所述样本目标车辆当前所在的车道进行目标车道段的搜索的步骤具体包括:

    3.如权利要求1或2所述的生成方法,其特征在于,所述目标车道段还包括与所述样本目标车辆可能经过的车道段相邻的同向车道段。

    4.如权利要求1所述的生成方法,其特征在于,每个车道被划分为多个长度相同的车道段。

    5.一种轨迹预测模型的训练方法,其特征在于,包括以下步骤:

    6.如权利要求5所述的训练方法,其特征在于,所述根据所述预测轨迹和所有车道段的车道标签计算轨迹分类损失的步骤具体包括:

    7.如权利要求6所述的训练方法,其特征在于,所述训练方法还包括:

    8.一种车辆轨迹的预测方法,其特征在于,包括以下步骤:

    9.一种车道标签的生成装置,其特征在于,包括:

    10.一种轨迹预测模型的训练装置,其特征在于,包括:

    11.一种车辆轨迹的预测装置,其特征在于,包括:

    12.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-4中任一项所述的生成方法的步骤、权利要求5-7中任一项所述的训练方法的步骤或者权利要求8所述的预测方法的步骤。

    13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-4中任一项所述的生成方法的步骤、权利要求5-7中任一项所述的训练方法的步骤或者权利要求8所述的预测方法的步骤。

    14.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-4中任一项所述的生成方法的步骤、权利要求5-7中任一项所述的训练方法的步骤或者权利要求8所述的预测方法的步骤。

    15.一种自动驾驶车辆,其特征在于,包括如权利要求12所述的电子设备。


    技术总结
    本公开公开了一种轨迹预测模型的训练方法、车辆轨迹的预测方法及车辆。其中,车道标签的生成方法包括:确定样本目标车辆当前所在的车道;根据道路网络沿着所述样本目标车辆当前所在的车道进行目标车道段的搜索;道路网络中的每个车道被划分为多个车道段,目标车道段包括所述样本目标车辆可能经过的车道段;将搜索到的所述目标车道段的车道标签标注为正标签,以及其它车道段的车道标签标注为负标签。将车道段的车道标签应用于轨迹预测模型的训练中可以指导其学习未来的多模态特性,允许非最佳匹配真值的轨迹存在一定的预测概率,从而避免单一模态过度自信而导致的模态缺失的问题,以提升轨迹预测模型的多模态表现,进而提高轨迹预测的准确性。

    技术研发人员:万长江,李金鑫,陆涛
    受保护的技术使用者:纵目科技(上海)股份有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-33972.html

    最新回复(0)