基于注意力机制的时空图卷积网络客流量预测方法与流程

    技术2024-11-24  51


    本发明涉及人工智能,尤其涉及一种基于注意力机制的时空图卷积网络客流量预测方法。


    背景技术:

    1、客流预测是维持城市交通正常运营的重要依据,对预防发生安全事故有着重要意义。乘客可以参考预测结果来合理出行计划,城市管理人员可以利用预测结果来提供事故预警,保障人员安全,避免交通拥堵。然而,由于容易受到其他因素的影响,如时空依赖性、拓扑信息、事件和天气条件,客流流预测一直是一项具有挑战性的任务。

    2、现有的客流预测技术有以下几种:

    3、1、基于数学模型的方法:将具有时间间隔的客流量转换为序列,利用统计学线性模型进行预测,如自回归移动平均预测模型、马尔可夫模型等2、机器学习方法:利用机器学习方法提取特征进行预测,如支持向量机,bp神经网络等

    4、3、深度学习方法:利用深度学习模型捕捉序列间的更多的特征信息,获取复杂的相关性,如长短期记忆网络(lstm)、门控循环单元(gru)网络等;使用卷积神经网络(cnn)来捕捉站点之间的空间相关性进行预测;基于图卷积神经网络(gcn)获取站点之间的空间拓扑信息进行预测,如将gcn与gru结合来获取客流量序列的时空特征。

    5、虽然以上方法都可以实现对客流量的预测,但存在如下问题:

    6、1、只考虑客流量序列的时间动态变化,或者只考虑空间依赖性,不能同时对时间特征和空间特征进行建模,因此不能准确地预测客流量数据的状态;

    7、2、城市公交、地铁站点是具有复杂拓扑结构的连接图,而卷积神经网络只能捕捉规则的欧几里德结构中的空间相关性,因此存在局限性;

    8、3、在获取客流量的时空相关性时忽略了捕捉关键站点的时空信息和上下文信息。

    9、鉴于以上问题,提出一种基于注意力机制的时空图卷积网络客流量预测方法。


    技术实现思路

    1、本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。

    2、鉴于上述的问题,提出了本发明。

    3、为解决上述技术问题,本发明提供如下技术方案:一种基于注意力机制的时空图卷积网络客流量预测方法,包括以下步骤:

    4、s1:从所需预测的区域的公交站点、地铁站点提取客流量数据进行预处理;

    5、s2:根据站点之间的连接函数确定每个位置点的关联程度,构建邻接矩阵a,将得到的邻接矩阵和与时间注意力机制组合的t个历史时间序列的客流量数据作为输入;

    6、s3:利用空间注意力机制和时间注意力机制捕捉客流量序列的依赖性;

    7、s4:采用多阶近似卷积核的gcn网络捕捉空间相关性,多阶近邻连接扩大图卷积的感受野;

    8、s5:搭建基于注意力机制的时空图卷积网络模型,包括构建两层的时空卷积块和一层全连接层;

    9、s6:模型训练,保存更新最优模型;

    10、s7:利用最优模型进行预测。

    11、作为本发明一种基于注意力机制的时空图卷积网络客流量预测方法的一种优选方案,其中,s1具体包括:

    12、s1.1:提取客流量数据;

    13、s1.2:使用线性插值的方式填充客流量数据中的缺失值和异常值;

    14、s1.3:按滑动窗口的方式对客流量数据进行时间切片;

    15、s1.4:使用线性函数方法对客流量数据进行归一化。

    16、作为本发明一种基于注意力机制的时空图卷积网络客流量预测方法的一种优选方案,其中,s2中邻接矩阵a具体表示为:

    17、

    18、其中,con(vi,vj)是节点vi和vj的连接函数。

    19、作为本发明一种基于注意力机制的时空图卷积网络客流量预测方法的一种优选方案,其中,所述空间注意力机制具体为:

    20、cs=ks·σ(w1x(l)w2+bs)

    21、

    22、其中,表示第l个时空组合块的输入,t(l)是第l层的时间维度长度,m(l)是第l层的属性特征数,ks,bs∈rn,是待训练的参数,cs表示注意力矩阵,cs(i,j)表示节点i与节点j的连通强度值,通过softmax函数来获取节点之间的空间相关程度并归一化。

    23、作为本发明一种基于注意力机制的时空图卷积网络客流量预测方法的一种优选方案,其中,所述时间注意力机制具体为:

    24、ct=kt·σ(w1(x(l))tw2+bt)

    25、

    26、其中,ks,w1∈rn,是待训练的参数,ct表示注意力矩阵,ct(i,j)表示时刻i与时刻j的关联强度值,通过softmax函数来获取客流量序列的时间相关程度并归一化。

    27、作为本发明一种基于注意力机制的时空图卷积网络客流量预测方法的一种优选方案,其中,s4中图卷积过程具体表示为:

    28、

    29、其中,为切比雪夫多项式tk(x)的k阶截断展开式,是在拉普拉斯矩阵l经过缩放变换形式后的k阶切比雪夫多项式,β∈rk是多项式的系数向量,k是图卷积核大小。

    30、作为本发明一种基于注意力机制的时空图卷积网络客流量预测方法的一种优选方案,其中,s5中所述时空卷积块由与空间注意力机制组合的图卷积中间层和两层时间卷积层构建,通过归一化防止过拟合,所述时空卷积块可以进行叠加堆叠多个。

    31、作为本发明一种基于注意力机制的时空图卷积网络客流量预测方法的一种优选方案,其中,时空卷积块的输出为:

    32、

    33、其中,σ和relu分别代表sigmoid和relu激励函数,φ1和φ2是两层时间卷积核的参数。

    34、作为本发明一种基于注意力机制的时空图卷积网络客流量预测方法的一种优选方案,其中,s6具体包括:

    35、s61,定义训练误差函数;

    36、s62,选取训练数据集、测试数据集和验证数据集,训练数据集、测试数据集和验证数据集的比例设置为7:2:1,采用adam函数作为模型优化函数,训练后模型进行保存。

    37、作为本发明一种基于注意力机制的时空图卷积网络客流量预测方法的一种优选方案,其中,所述误差函数具体为:

    38、

    39、其中,表示实际值与预测值的l2范数,λlreg是正则化项,用于防止模型的过拟合。

    40、本发明的有益效果:通过将时间注意机制与时空卷积结合,获取站点间空间相关程度和客流量信息的时序关联性,时空卷积块融合了空间维度的图卷积和时间维度的标准卷积,能够有效地捕捉客流量数据的动态时空特征,提高了预测精度,采用的基于注意力机制的时空图卷积网络模型完全由卷积结构组成,以能够更少的参数和更快的训练速度实现了对输入的并行化。



    技术特征:

    1.一种基于注意力机制的时空图卷积网络客流量预测方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的一种基于注意力机制的时空图卷积网络客流量预测方法,其特征在于,s1具体包括:

    3.根据权利要求1所述的一种基于注意力机制的时空图卷积网络客流量预测方法,其特征在于,s2中邻接矩阵a具体表示为:

    4.根据权利要求1所述的一种基于注意力机制的时空图卷积网络客流量预测方法,其特征在于,所述空间注意力机制具体为:

    5.根据权利要求4所述的一种基于注意力机制的时空图卷积网络客流量预测方法,其特征在于,所述时间注意力机制具体为:

    6.根据权利要求1所述的一种基于注意力机制的时空图卷积网络客流量预测方法,其特征在于,s4中图卷积过程具体表示为:

    7.根据权利要求1所述的一种基于注意力机制的时空图卷积网络客流量预测方法,其特征在于:s5中所述时空卷积块由与空间注意力机制组合的图卷积中间层和两层时间卷积层构建,通过归一化防止过拟合,所述时空卷积块可以进行叠加堆叠多个。

    8.根据权利要求7所述的一种基于注意力机制的时空图卷积网络客流量预测方法,其特征在于,时空卷积块的输出为:

    9.根据权利要求1所述的一种基于注意力机制的时空图卷积网络客流量预测方法,其特征在于,s6具体包括:

    10.根据权利要求6所述的一种基于注意力机制的时空图卷积网络客流量预测方法,其特征在于,所述误差函数具体为:


    技术总结
    本发明公开了一种基于注意力机制的时空图卷积网络客流量预测方法,包括:客流量数据预处理输入、利用时间注意力机制和空间注意力机制捕捉客流量序列的依赖性、构建时空卷积块、时空图模型搭建、模型训练和客流量预测;其有益效果为:通过将时间注意机制与时空卷积结合,获取站点间空间相关程度和客流量信息的时序关联性,时空卷积块融合了空间维度的图卷积和时间维度的标准卷积,能够有效地捕捉客流量数据的动态时空特征,提高了预测精度,采用的基于注意力机制的时空图卷积网络模型完全由卷积结构组成,以能够更少的参数和更快的训练速度实现了对输入的并行化。

    技术研发人员:吕彩云
    受保护的技术使用者:天翼云科技有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-22538.html

    最新回复(0)