基于MLP的时序数据长期预测方法、设备和介质

    技术2026-05-13  6


    本发明属于时间序列长期预测,尤其是涉及一种基于mlp的时序数据长期预测方法、设备和介质。


    背景技术:

    1、时间序列是指将按同一统计指标采集的数值按照其发生的时间先后顺序排列而成的数列,随着数字化程度越来越高,时间序列的场景和数量不断增长,例如交通流序列、销售额序列、气候数据序列等。预测作为时间序列分析中的一个重要方向,在过去的几十年中被广泛研究。随着算力和数据量的不断增强,人们也对时间序列预测的精度和范围提出了越来越高的要求。近年来,越来越多的研究开始聚焦时间序列的多步预测,与一步预测相比,多步预测为用户提供了对整个未来路径的估计,可以允许决策者提前规划、及时分配资源、动态调整策略,这对于交通、能源、气候等领域是至关重要的。而在多步预测中,相较于短期预测,长期预测的难度更高,但收益更大,并且可以向下兼容,进一步增强了上述方面存在的优势,能够为决策者提供更多的决策时间和空间,进一步减轻决策压力。

    2、目前,有大量研究致力于时间序列数据长期预测,但同时也存在一系列的挑战:

    3、1.现有多步预测方法的通用性有待提升。传统的时序预测方法往往难以适应多种不同业务场景的需求,需要投入大量人力物力面向不同业务场景设计针对性的算法。深度学习算法得益于其强大的泛化能力,一定程度上解决了这一痛点,中国专利申请cn117713053a公开了一种融合图结构表征的电力负荷预测方法,通过多个目标区域的多个目标客户的历史电力负荷时序数据样本对融合图结构表征的深度学习模型进行训练得到电力负荷预测模型。但这种特征融合的策略导致方法所用模型的结构显著依赖于特定业务场景的不同特征,设计出的模型难以像nlp、cv中的大模型一样在跨领域的众多数据集间进行训练,限制了模型的通用性。

    4、2.现有多步预测方法对季节性和趋势性的建模不平衡。季节性和趋势性是时间序列中广泛存在的两大基本特征,近期的研究通常用序列分解模块将时间序列分解为季节项和趋势项,随后对分解项分别进行建模和预测,但是绝大多数方法仍专注于季节项的建模,对趋势项的建模较为粗糙,这显然是不合理的,也限制了模型的通用性。

    5、3.现有多步预测方法的轻量化有待提升。近期基于transformer的通用性大模型在nlp、cv领域展现出了强大的泛化能力,但transformer在计算资源方面的消耗十分巨大,而时序领域有很多场景对时效性有着较高要求,如果将transformer应用到时序预测领域时,会对方法的时效性和部署造成严重阻碍。

    6、综上,需要设计一种通用性强的时序数据长期预测方法,可以快速、准确进行时间序列数据的长期预测。


    技术实现思路

    1、本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于mlp的时序数据长期预测方法、设备和介质,可以快速、准确实现时间序列数据的长期预测。

    2、本发明的目的可以通过以下技术方案来实现:

    3、本发明提供一种基于mlp的时序数据长期预测方法,包括以下步骤:

    4、获取维度为n的多维时间序列数据,输入基于mlp的时序数据长期预测模型,获得时序数据长期预测结果;

    5、其中,所述基于mlp的时序数据长期预测模型依次包括多尺度分解模块、并列的下采样信息融合模块和局部信息提取模块,所述下采样信息融合模块和所述局部信息提取模块后接协变量融合模块,所述基于mlp的时序数据长期预测模型对输入数据的处理过程如下:

    6、s1、采用通道独立策略,将n维时间序列视为n条一维时间序列,每条一维时间序列通过所述多尺度分解模块进行解耦,获得相应的季节项和趋势项;

    7、s2、将季节项输入所述下采样信息融合模块进行不同粒度下周期特征的提取和融合,获得季节项初步预测值;将趋势项输入所述局部信息提取模块进行全局信息交互和局部特征的进一步提取,获得趋势项初步预测值;

    8、s3、所述协变量融合模块通过引入时间协变量信息分别对季节项初步预测值和趋势项初步预测值进行微调,然后将微调后的季节项初步预测值和趋势项初步预测值相加,得到输入时间序列初步预测值;

    9、s4、将输入时间序列初步预测值输入所述协变量融合模块再次进行微调,然后通过revin进行逆归一化,获得时序数据长期预测结果。

    10、进一步地,步骤s1中,将每条一维时间序列通过revin进行归一化后输入所述多尺度分解模块,所述多尺度分解模块的数据处理过程如下:

    11、对归一化后的一维时间序列进行填充操作和平均池化操作,获得不同周期长度下的趋势项,进而解耦获得不同周期长度下的季节项;

    12、对各周期长度下的趋势项和季节项分别进行融合,获得每条一维时间序列的季节项和趋势项。

    13、进一步地,步骤s2中,所述下采样信息融合模块包括m层堆叠的下采样融合子模块,其中,前m-1层下采样融合子模块用于融合不同粒度下采样序列的周期特征,逐层生成季节项预测值的中间层隐藏状态,最后一层下采样融合子模块用于将不同粒度下采样序列的周期特征通过多层感知机进行映射,获得季节项初步预测值;

    14、其中,每层下采样融合子模块包括多个并列的下采样信息提取单元,每个下采样信息提取单元对输入数据以一种粒度依次进行下采样、维度展开和还原操作,以获得一种粒度下采样序列的周期特征。

    15、进一步地,采样粒度为a的下采样信息提取单元的具体计算过程如下:

    16、

    17、(m=1时使用)

    18、其中,表示第l层的输入和第l-1层的输出,ds为下采样融合子模块中中间层输出项的隐藏层维度,sampling()为下采样,flatten()表示将输入的时间维度和变量维度进行展开,mlp为多层感知机,resape()为表示将输入还原为时间维度或变量维度的形状,merge()表示将下采样序列按照原来的时间顺序进行还原,表示经过粒度为a的下采样操作后预测得到的季节项序列,l为回顾窗口长度,表示经过粒度为a的下采样操作后预测得到的季节项序列,h为预测窗口的长度。

    19、进一步地,步骤s2中,所述局部信息提取模块依次包括卷积层、局部增强层和全连接层;

    20、其中,所述卷积层用于对所述趋势项进行局部特征的聚合,所述局部增强层包括两个多层感知机,分别作用于时间维度和变量维度,用于进行全局信息交互和局部信息的进一步提取,所述全连接层用于根据所述局部增强层的输出得到趋势项初步预测值。

    21、进一步地,所述卷积层为一组一维卷积,其步幅设置为卷积核大小的一半。

    22、进一步地,所述局部增强层的具体计算过程如下:

    23、

    24、其中,为表示第l层局部增强层的输入和第l-1层局部增强层的输出,mlpt()表示作用于时间维度的多层感知机,mlpv()表示作用于变量维度的多层感知机,为第l层局部增强层的输出。

    25、进一步地,所述协变量融合模块的具体计算过程如下:

    26、y′mark=embedding(ymark)

    27、y″=mlpv(concat(y′,y′mark))

    28、其中,ymark表示原始的时间协变量,y′mark表示嵌入后的时间协变量,y′表示输入该模块的趋势项初步预测值、季节项初步预测值或输入时间序列初步预测值,concat()表示将输入在变量维度进行拼接,mlpv()表示作用于变量维度的多层感知机,y"为该模块的输出。

    29、本发明还提供一种电子设备,包括存储器、处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现上述方法。

    30、本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述方法。

    31、与现有技术相比,本发明具有以下有益效果:

    32、1、本发明设计了一个基于mlp的时序数据长期预测模型,可以根据多维时间序列获得时序数据长期预测结果,其中,基于mlp的时序数据长期预测模型包括多尺度分解模块、下采样信息融合模块、局部信息提取模块和协变量融合模块,其对输入数据的处理过程如下:首先,采用通道独立策略,将n维时间序列视为n条一维时间序列,每条一维时间序列通过多尺度分解模块进行解耦,获得相应的季节项和趋势项;然后,将季节项输入下采样信息融合模块进行不同粒度下周期特征的提取和融合,获得季节项初步预测值,将趋势项输入所述局部信息提取模块进行全局信息交互和局部特征的进一步提取,获得趋势项初步预测值;其次,协变量融合模块通过引入时间协变量信息分别对季节项初步预测值和趋势项初步预测值进行微调,将微调后的季节项初步预测值和趋势项初步预测值相加,得到输入时间序列初步预测值;最后,将输入时间序列初步预测值输入协变量融合模块再次进行微调,然后通过revin进行逆归一化,获得时序长期预测结果;上述方案基于通道独立策略,可以对输入序列进行高效解耦,实现跨数据集训练和预测,增强了模型的通用性;同时,根据季节项和趋势项的特征分别设计了针对性的建模方案,提升了模型应用于具有不同特征的数据集的能力,增强了模型的通用性,具体地,为季节项设计了下采样信息融合模块,在显式的保留序列周期性的情况下,从序列整体的角度出发,挖掘其中隐藏的周期特征,为趋势项设计了局部信息提取模块,强化趋势项中相邻时间步之间的联系,捕获其局部特征;最后设计了一个协变量融合模块,用于奖初步预测值与时间信息整合,提高模型的预测性能和通用性。

    33、2、本发明中,下采样信息融合模块包括m层堆叠的下采样融合子模块,其中,前m-1层下采样融合子模块用于融合不同粒度下采样序列的周期特征,逐层生成季节项预测值的中间层隐藏状态,最后一层下采样融合子模块用于将不同粒度下采样序列的周期特征通过多层感知机进行映射,获得季节项初步预测值;每层下采样融合子模块包括多个并列的下采样信息提取单元,每个下采样信息提取单元对输入数据以一种粒度依次进行下采样、维度展开和还原操作,以获得一种粒度下采样序列的周期特征,既保留了时间序列的特征,同时也减少了冗余信息影响,降低了计算复杂度。

    34、3、本发明中,局部信息提取模块包括卷积层、局部增强层和全连接层,其中,卷积层用于对所述趋势项进行局部特征的聚合,且卷积层为一组一维卷积,其步幅设置为卷积核大小的一半,可以减少冗余信息,降低后续操作的复杂度;局部增强层包括两个多层感知机,一个作用于时间维度,可以对卷积层处理后的局部信息进行一次全局的信息交互,获取远处可能存在的有效信息,另一个作用于变量维度,可以针对每一个时间步的局部信息进行进一步的特征提取,因此,局部增强层可以学习到的复杂特征表示,对未见过的数据具有较好的泛化能力。

    35、4、本发明中,协变量融合模块可以使得模型有效地感知到时间协变量的作用,避免了有效信息的丢失;最后通过revin进行逆归一化,获得时序长期预测结果可以缓解时间序列的分布偏移问题。

    36、5、本发明提出的基于mlp的时序数据长期预测模型中,各模块主要基于多层感知机设计,相较于以往的长期预测方法,在训练推理速度和gpu内存占用方面有着较大提升。


    技术特征:

    1.一种基于mlp的时序数据长期预测方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的一种基于mlp的时序数据长期预测方法,其特征在于,步骤s1中,将每条一维时间序列通过revin进行归一化后输入所述多尺度分解模块,所述多尺度分解模块的数据处理过程如下:

    3.根据权利要求1所述的一种基于mlp的时序数据长期预测方法,其特征在于,步骤s2中,所述下采样信息融合模块包括m层堆叠的下采样融合子模块,其中,前m-1层下采样融合子模块用于融合不同粒度下采样序列的周期特征,逐层生成季节项预测值的中间层隐藏状态,最后一层下采样融合子模块用于将不同粒度下采样序列的周期特征通过多层感知机进行映射,获得季节项初步预测值;

    4.根据权利要求3所述的一种基于mlp的时序数据长期预测方法,其特征在于,采样粒度为a的下采样信息提取单元的具体计算过程如下:

    5.根据权利要求1所述的一种基于mlp的时序数据长期预测方法,其特征在于,步骤s2中,所述局部信息提取模块依次包括卷积层、局部增强层和全连接层;

    6.根据权利要求5所述的一种基于mlp的时序数据长期预测方法,其特征在于,所述卷积层为一组一维卷积,其步幅设置为卷积核大小的一半。

    7.根据权利要求5所述的一种基于mlp的时序数据长期预测方法,其特征在于,所述局部增强层的具体计算过程如下:

    8.根据权利要求1所述的一种基于mlp的时序数据长期预测方法,其特征在于,所述协变量融合模块的具体计算过程如下:

    9.一种电子设备,包括存储器、处理器,以及存储于所述存储器中的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中任一所述的方法。

    10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任一所述的方法。


    技术总结
    本发明涉及一种基于MLP的时序数据长期预测方法、设备和介质,包括以下步骤:获取多维时间序列,输入基于MLP的时序数据长期预测模型,获得时序长期预测结果;基于MLP的时序数据长期预测模型包括多尺度分解模块、下采样信息融合模块、局部信息提取模块和协变量融合模块,该模型对输入的处理过程如下:通过多尺度分解模块将多维时间序列进行解耦,获得季节项和趋势项;将季节项和趋势项分别输入下采样信息融合模块和局部信息提取模块,获得相应的初步预测值;协变量融合模块分别对季节项和趋势项的初步预测值进行微调,将微调结果相加后输入协变量融合模块再次微调,并进行逆归一化。与现有技术相比,本发明可以快速准确实现时间序列的长期预测。

    技术研发人员:方晋,郭鑫,黄佩文,宋雨薇,吴坚
    受保护的技术使用者:上海海事大学
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-42785.html

    最新回复(0)