一种基于TCN神经网络的PM2.5预测方法

    技术2025-05-20  10


    本发明涉及一种空气质量预测方法,尤其涉及一种基于tcn神经网络的pm2.5预测方法。


    背景技术:

    1、基于深度学习的人工智能模型在空气质量预测表现优异,如支持向量机(svm)、误差逆向传播(bp)神经网络、极限学习机(elm)等。但这些应用前馈模型不会根据数据集的具体情况进行调整,更适用于非实时更新的数据。时域卷积网络(tcn)由于其独特的结构和对长序列数据的处理能力,展现出明显的优势,这些优势使得tcn成为空气质量预测领域中的一个有前途的模型选择。

    2、现有的pm2.5预测模型中的局限性主要有:首先,现有的模型中所采用的emd、vmd分解方法无法充分提取数据中的所有潜在特征,尤其是那些非平稳性和复杂性较高的特征,这些特征对于pm2.5浓度的准确预测至关重要。由于这些特征未被充分提取,预测模型在处理复杂pm2.5数据时会影响到模型的预测精度和稳定性。其次,在现有技术中难以通过调节vmd和tcn模型参数达到最佳的分解参数组合和模型参数组合,从而影响了分解过程和模型预测的效果和效率,数据分解的质量和预测模型的性能不高。


    技术实现思路

    1、发明目的:针对以上问题,本发明提出一种基于tcn神经网络的pm2.5预测方法,能够提高pm2.5预测模型的预测精度和稳定性,为空气质量管理提供更加准确和可靠的预测结果。

    2、技术方案:本发明所采用的技术方案是一种基于tcn神经网络的pm2.5预测方法,包括以下步骤:

    3、步骤1,获取空气监测站点pm2.5历史数据集并预处理;

    4、步骤2,采用经验模态分解算法将pm2.5数据进行分解,得到各imf分量以及残差量;

    5、步骤3,计算各imf分量以及残差量的样本熵;根据各imf分量的样本熵,利用k均值聚类算法将imf分量分成高、中、低频分量;

    6、步骤4,利用变分模态分解算法对高频分量采用进行再分解,得到变分模态分解后的imf分量以及对应的残差量;采用麻雀搜索算法优化所述变分模态分解算法的分解模态个数k和惩罚参数ɑ;

    7、步骤5,针对变分模态分解后的imf分量以及对应的残差量,以及步骤3得到的中、低频分量,分别构建tcn神经网络预测模型,各tcn神经网络预测模型学习并输出预测值;采用麻雀搜索算法优化所述tcn神经网络预测模型的参数;

    8、步骤6,将每个tcn神经网络预测模型所得预测值进行反归一化处理,再聚合得到最终的pm2.5预测值。

    9、所述样本熵的计算方法包括:

    10、(1)设时间序列为x(1),x(2),x(3)…x(n),按照顺序取其长度为m的样本,其中第i个样本可以表示为x(i)=[x(i),x(i+1)…x(i+m-1)],i=1~n-m-1;

    11、(2)定义x(i)与x(j)间的距离d[x(i),x(j)]是两个对应元素中最大差值的绝对值:

    12、d[x(i),x(j)]=max[|x(i+k)-x(j+k)|]

    13、式中,k用于指示在两个向量x(i)与x(j)中比较的对应元素,d[x(i),x(j)]定义了这两个向量之间的距离;

    14、(3)给定阈值r,对每个i值统计d[x(i),x(j)]小于阈值r的数目与距离总数的比值,记作

    15、

    16、式中,bm(r)表示在时间序列中存在的所有长度为m的子序列与其后续元素相似的概率的平均值,n为时间序列长度,m为模板长度,r为相似度阈值;

    17、(4)求解出时间序列的样本熵:

    18、

    19、式中,sampen(m,r)表示样本熵。

    20、对vmd分解建立如下优化问题:

    21、

    22、其中,l({uk},{ωk},λ)表示优化目标,α0为惩罚因子;λ为拉格朗日乘法算子,uk为第k个模态函数分量;ωk为第k个模态函数的中心频率;δ(t)为狄拉克函数,||·||表示范数,f(t)表示原始信号,*表示卷积算子,t表示时间。

    23、采用麻雀搜索算法优化所述变分模态分解算法的分解模态个数k和惩罚参数ɑ,包括:

    24、(1)将分解模态个数k和惩罚参数ɑ初始值作为麻雀搜索算法的优化目标构建解空间,预设置ssa算法中麻雀种群个数、预警值大小、迭代次数、发现者麻雀占比、追随者麻雀占比和预警者麻雀占比、适应度函数;

    25、(2)初始化麻雀种群,并将k和ɑ初始值赋值给vmd算法计算适应度函数初始值;

    26、(3)更新发现者、追随者和预警者的位置,计算适应度函数并排序;

    27、(4)计算停止条件,满足则输出最优适应度对应的参数值,否则,重复上述步骤进行迭代。

    28、采用麻雀搜索算法优化所述tcn神经网络预测模型的参数,包括:

    29、(1)将待优化的tcn神经网络预测模型的初始学习率和隐藏层神经元个数作为麻雀搜索算法的优化目标构建解空间,预设置ssa算法中麻雀种群个数、预警值大小、迭代次数、发现者麻雀占比、追随者麻雀占比和预警者麻雀占比、适应度函数和初始适应度值;将tcn预测模型输出的预测值与实际值的均方根误差作为适应度函数;

    30、(2)初始化麻雀种群;

    31、(3)更新发现者、追随者和预警者的位置,计算适应度函数并排序;

    32、(4)计算停止条件,满足则输出最优适应度对应的参数值,否则,重复上述步骤进行迭代。

    33、麻雀搜索算法中的发现者的位置更新描述为:

    34、

    35、式中,t为当前迭代次数;t为最大迭代次数;为t时刻第i只麻雀在第j(j∈[1,d])维的位置信息,d表示空间维数;α为(0,1]的均匀随机数;q为服从正态分布的随机数;r2和st分别为预警值和安全值;l为1×d的单位矩阵。

    36、麻雀搜索算法中的追随者的位置更新描述为:

    37、

    38、式中:为t+1时刻第i只麻雀在第j(j∈[1,d])维的位置信息,为t时刻第i只麻雀在第j(j∈[1,d])维的位置信息,d表示空间维数,q为服从正态分布的随机数,为当前全局最差的位置;为目前发现者所占据的最优位置;a为1×d的元素随机分配为1或-1的矩阵,a+=at(aat)-1;l为1×d的单位矩阵,n’为种群数量。

    39、麻雀搜索算法中的预警者的位置更新描述为:

    40、

    41、式中:为t+1时刻第i只麻雀在第j(j∈[1,d])维的位置信息,为t时刻第i只麻雀在第j(j∈[1,d])维的位置信息,为当前全局最优位置,β为服从正态分布的随机数;γ为[-1,1]中的一个随机数,为当前全局最差的位置,fi为当前麻雀个体的适应度,fg和fw分别为当前全局最佳和最差的适应度值;ε为防止分母为零的常数。

    42、本发明提出一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的基于tcn神经网络的pm2.5预测方法。

    43、本发明提出一种计算机程序产品,包括计算机程序和/或指令,该计算机程序和/或指令被处理器执行时实现所述的基于tcn神经网络的pm2.5预测方法。

    44、有益效果:相比于现有技术,本发明具有以下优点:本发明通过引入模态分解,可将非平稳、非线性原始时间序列转化为若干子序列并重构,解决了pm2.5数据波动大、难以准确预测问题;通过对高频分量进行二次vmd分解,可以有效地提取时序数据显著特征,将二次分解得到的子序列和未二次分解的子序列作为模型输入特征,有效提高了预测精度;利用ssa优化tcn网络、vmd分解的关键参数选取问题,解决人工参数调整耗时和预测效果差的问题。


    技术特征:

    1.一种基于tcn神经网络的pm2.5预测方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的基于tcn神经网络的pm2.5预测方法,其特征在于:所述样本熵的计算方法包括:

    3.根据权利要求1所述的基于tcn神经网络的pm2.5预测方法,其特征在于:对vmd分解建立如下优化问题:

    4.根据权利要求1所述的基于tcn神经网络的pm2.5预测方法,其特征在于:采用麻雀搜索算法优化所述变分模态分解算法的分解模态个数k和惩罚参数ɑ,包括:

    5.根据权利要求1所述的基于tcn神经网络的pm2.5预测方法,其特征在于:采用麻雀搜索算法优化所述tcn神经网络预测模型的参数,包括:

    6.根据权利要求1所述的基于tcn神经网络的pm2.5预测方法,其特征在于:麻雀搜索算法中的发现者的位置更新描述为:

    7.根据权利要求1所述的基于tcn神经网络的pm2.5预测方法,其特征在于:麻雀搜索算法中的追随者的位置更新描述为:

    8.根据权利要求1所述的基于tcn神经网络的pm2.5预测方法,其特征在于:麻雀搜索算法中的预警者的位置更新描述为:

    9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的基于tcn神经网络的pm2.5预测方法。

    10.一种计算机程序产品,包括计算机程序和/或指令,其特征在于,该计算机程序和/或指令被处理器执行时实现权利要求1至8中任一项所述的基于tcn神经网络的pm2.5预测方法。


    技术总结
    本发明公开了一种基于TCN神经网络的PM2.5预测方法,包括获取空气监测站点PM2.5历史数据集并预处理;采用经验模态分解算法将数据进行分解,得到各IMF分量以及残差量;计算各IMF分量以及残差量的样本熵;根据各IMF分量的样本熵,利用K均值聚类算法将IMF分量分成高、中、低频分量;利用变分模态分解算法对高频分量采用进行再分解,得到变分模态分解后的IMF分量以及对应的残差量;针对变分模态分解后的IMF分量以及对应的残差量,以及中、低频分量,分别构建TCN预测模型;将每个TCN预测模型所得预测值进行反归一化处理,再聚合得到最终的PM2.5预测值。本发明为空气质量管理提供更加准确和可靠的预测结果。

    技术研发人员:姜坤,尹晓琦,吕艳,张兴宇,杨航,洪利,李学军,谷臣斌
    受保护的技术使用者:淮阴工学院
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-30985.html

    最新回复(0)