一种基于分层注意力机制的行人轨迹预测方法

    技术2024-12-26  44


    本发明属于自动驾驶,涉及一种多重隐式协调图应用分层注意力机制在多类型交互场景下的行人轨迹预测方法,尤其是一种基于分层注意力机制的行人轨迹预测方法。


    背景技术:

    1、随着深度学习的发展,多智能体系统建模是近年来人工智能领域的热点研究问题,应用在自动驾驶、人群导航、人机协作等方面。行人轨迹预测是在社交聚会中,根据行人的历史轨迹、社交意图以及周围行人运动的影响等,推测出目标行人在未来的位置。准确的行人轨迹预测对自动驾驶技术的发展至关重要,该预测可以辅助汽车在驾驶过程中做出正确的决策;同时,准确的行人轨迹预测是智慧交通的基础部件,若能准确预测行人在各个路口的行为,可以提前识别潜在风险,通过智慧交通系统将警告信息发送给行人与车辆,降低交通事故的概率。可见,行人轨迹预测的研究具有十分重要的现实意义。

    2、目前,国内外学者对多行人轨迹预测进行了大量的研究,主要包括以下几个方面:一、基于深度学习的行人轨迹预测:深度学习在多行人轨迹预测中得到了广泛应用,如social lstm模型能有效捕获行人间的社会交互。social gan模型,该模型通过引入生成对抗网络(gan),使得生成的轨迹更加自然和多样化;二、基于图神经网络的行人轨迹预测:图神经网络是一种能够处理图结构数据的神经网络,可以有效地捕捉行人之间的交互和依赖关系。如social-stgcnn模型,通过采用空间-时间图卷积网络,成功捕捉行人间的空间和时间依赖关系。三、基于强化学习的行人轨迹预测:强化学习是一种通过与环境的交互来学习和优化策略的机器学习方法,可以有效地处理行人轨迹预测中的不确定性和动态性问题。如rl-lstm的模型,通过引入深度强化学习,可以有效地处理行人轨迹预测中的不确定性和动态性问题;四、基于注意力机制的行人轨迹预测:注意力机制是一种能够自动关注重要信息的机制,可以有效地处理行人轨迹预测中的不确定性和复杂性问题。如sophie模型,通过引入注意力机制,可以有效地处理行人轨迹预测中的不确定性和复杂性问题。

    3、但是,行人轨迹预测的研究还存在诸多难点。首先,多个体行人的行为常受复杂、动态交互影响,如导航场景中,目标位置和避免碰撞等交互影响个体行为,使得轨迹建模和预测具有挑战性;其次,行人轨迹预测受制于数据的不完整性和不确定性。实际应用中,可观察轨迹数据有限,且存在噪声和不确定性,这增加了预测难度;再者,轨迹预测需考虑行人之间的互动和协同行为。行人行为常受其他行人的影响,这种动态、复杂的互动使得互动建模和预测变得困难;最后,轨迹预测需掌握长期时间依赖性。行人行为常受过去轨迹和环境影响,需能捕捉和建模时间依赖性,增加了预测的复杂性。所以,轨迹预测的难度在于交互影响、数据不完整和不确定性、行人间的互动以及时间依赖性。解决这些问题需要创新的模型和算法,来处理复杂的多行人系统。


    技术实现思路

    1、本发明的目的在于克服上述现有技术的缺点,提供一种基于分层注意力机制的行人轨迹预测方法,以解决现有技术中没有明确处理社交群体系统中存在的多层次交互,并且在长期预测和解释性方面存在性能下降的技术问题。

    2、为达到上述目的,本发明采用以下技术方案予以实现:

    3、一种基于分层注意力机制的行人轨迹预测方法,包括以下步骤:

    4、s1,获得n个行人在某个时间位置特征向量;

    5、s2,将n个行人的位置特征向量嵌入至编码器中的图神经网络gnn,作为图神经网络gnn多重注意力图中的初始节点向量;基于初始节点向量,获得初始节点隐状态;基于多重注意力图中各个初始节点隐状态,通过多层感知机mlp网络,获得边的初始未归一化权重;基于初始未归一化权重,对边嵌入进行分类获得k个图层,获得每一个图层初始关系矩阵;基于每一个图层初始关系矩阵,拼接后多重注意力图的初始隐变量;

    6、其中,每一个图层通过各自的编码器网络学习;

    7、s3,将初始节点向量转换为隐态表征,进而计算边的隐状态;基于边的隐状态更新初始节点隐状态,获得更新节点隐状态,进一步的更新边的隐状态,获得更新后的边的隐状态;基于更新的边的隐状态和更新节点隐状态,获得更新的图层关系矩阵;

    8、s4,通过解码器对节点隐状态进行解码,基于更新的节点隐状态,将初始关系矩阵作为注意力图,聚合每一个图层中行人之间相互作用强度、以及其他行人对所述节点对应行人的影响,获得聚合消息;基于聚合消息和更新的节点隐状态,通过门控循环单元更新所述节点对应行人的隐状态,结合读出网络获得行人的下一个位置特征;

    9、s5,重复s3和s4,持续预测行人的下一个位置特征,获得行人轨迹。

    10、本发明的进一步改进在于:

    11、优选的,s2中,通过嵌入函数fembed(),将初始节点向量转换为初始节点隐状态。

    12、优选的,s2和s3中,通过图神经网络中每个节点隐状态,获得边的隐状态公式为:

    13、e(i,j)=fe([hi,hj]

    14、其中,hi,hj分别是节点i和节点j的隐状态向量,fe是多层感知机mlp网络,e(i,j)为边的未归一化权重。

    15、优选的,s3中,

    16、基于边的隐状态更新节点的隐状态的公式为:

    17、

    18、其中,fv为图神经网络gnn。

    19、优选的,s2和s3中,通过注意力机制获得更新的图层关系矩阵,计算公式为:

    20、

    21、其中,通过注意力机制attention(ek(i,j))计算得到输出,代表了行人i和行人j在图层k中的关系强度;softmaxj(ek(i,j))为softmax函数,用于归一化注意力机制计算后的输出,分母是对所有j'在邻域nj中的exp(ek(i,j'))求和,用于归一化。

    22、优选的,s4中,聚合消息的获得公式为:

    23、

    24、其中,zk是由多重注意力机制计算得到的关系矩阵,代表不同图层k中智能体之间的相互作用强度;为在图层k中,行人i对行人j的影响。

    25、优选的,s4中,通过读出网络预测行人的下一个位置特征的公式为:

    26、”'

    27、xj=fout(hj)

    28、其中,fout为读出网络,h″j为隐状态,x′j为预测特征。

    29、优选的,s4中,通过门控循环单元更新所述节点对应行人的隐状态的公式为:

    30、h′j=gru(msgj,hj)

    31、其中,msgj为第j个行人的聚合消息,hj为行人j的隐状态。

    32、优选的,s2中,每一个图层的编码器网络为:

    33、

    34、其中,fenck是一个独立编码器网络,参数为

    35、优选的,s2的编码器和s4的解码器训练时,通过重构损失函数和kl散度损失函数训练。

    36、与现有技术相比,本发明具有以下有益效果:

    37、本发明公开了一种基于多重关系图注意力机制的新方法,用于学习和预测多行人社交系统中的交互动态。该方法通过更准确地捕捉复杂多行人环境中的各种交互,以提高预测任务和关系推理的准确性。基于多重网络理论,利用多层关系图学习不同层级的交互关系,每一层通过注意力机制相互作用和影响,并使用从简单到复杂的分层训练策略,以分阶段、渐进的方式学习和完善模型。在三个不同的多行人数据集上进行实验,对比其他基线模型在预测任务和关系推理任务上的性能。结果表明,本发明提出的方法显著优于传统基线模型,为多行人系统中的交互动态学习提供了一种有效的方法;能够同时表示多种独立类型的交互,并考虑社交关系中的不同强度的系统和方法,

    38、(1)使用多重注意力图作为隐变量表示,显式地建模多层交互关系,更好地捕捉社交多行人系统的动态。引入注意力机制,表示关系的不同强度。分层训练策略稳定训练,进一步提升预测性能。

    39、(2)隐变量表示具有较好的可解释性,通过条件生成等方式探索交互影响。分层训练保持预测性能的同时更好地降低隐变量间的依赖性,提升模型鲁棒性。


    技术特征:

    1.一种基于分层注意力机制的行人轨迹预测方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的一种基于分层注意力机制的行人轨迹预测方法,其特征在于,s2中,通过嵌入函数fembed(),将初始节点向量转换为初始节点隐状态。

    3.根据权利要求1所述的一种基于分层注意力机制的行人轨迹预测方法,其特征在于,s2和s3中,通过图神经网络中每个节点隐状态,获得边的隐状态公式为:

    4.根据权利要求1所述的一种基于分层注意力机制的行人轨迹预测方法,其特征在于,s3中,

    5.根据权利要求1所述的一种基于分层注意力机制的行人轨迹预测方法,其特征在于,s2和s3中,通过注意力机制获得更新的图层关系矩阵,计算公式为:

    6.根据权利要求1所述的一种基于分层注意力机制的行人轨迹预测方法,其特征在于,s4中,聚合消息的获得公式为:

    7.根据权利要求1所述的一种基于分层注意力机制的行人轨迹预测方法,其特征在于,s4中,通过读出网络预测行人的下一个位置特征的公式为:

    8.根据权利要求1所述的一种基于分层注意力机制的行人轨迹预测方法,其特征在于,s4中,通过门控循环单元更新所述节点对应行人的隐状态的公式为:

    9.根据权利要求1所述的一种基于分层注意力机制的行人轨迹预测方法,其特征在于,s2中,每一个图层的编码器网络为:

    10.根据权利要求1所述的一种基于分层注意力机制的行人轨迹预测方法,其特征在于,s2的编码器和s4的解码器训练时,通过重构损失函数和kl散度损失函数训练。


    技术总结
    本发明公开了一种基于分层注意力机制的行人轨迹预测方法,属于自动驾驶技术领域。该方法在预测过程中使用多重注意力图表示隐变量,建立多层交互关系,更好地捕捉社交多行人系统的动态;通过引入注意力机制,表示关系的不同强度;基于多重网络理论,结合多层关系图学习不同层级的交互关系,每一层通过注意力机制相互作用和影响,并使用从简单到复杂的分层训练策略,以分阶段、渐进的方式学习和完善模型。

    技术研发人员:张瑜,齐世霞,董军堂,雷文礼,任新成
    受保护的技术使用者:延安大学
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-24286.html

    最新回复(0)