本发明属于时序预测,特别是涉及一种基于局部均值分解和sma-transformer的数据预测方法。
背景技术:
1、有源低压配网户变关系,指在电力配网系统中,将高压电网的电能通过变压器降压为低压电能,然后转送给小区或者单个建筑物的户内用电设备的过程;在实际运行中,精准地进行户变关系预测十分重要,在对有源低压配网户变关系数据进行时序预测时,通常预测方法可划分为三类:数据驱动、模型驱动与混合型方法。数据驱动方法依赖于历史消耗模式和统计学原理,利用时间序列、回归和聚类等方法预计未来短期的供电关系;模型驱动方法,依据电网的物理规律,结合负载和线路模型,揭示了用电行为与供电关系提供了框架;混合方法则融合上述两种途径的优点,采用决策树、随机森林、神经网络等机器学习技术,从历史数据中识别规律,同时考量物理模型,从而增强预测的精度及其鲁棒性。
2、每种方法均有不足之处,数据驱动方法高度依赖于数据完整性,易受到数据丢失和异常的妨碍,且在供电关系不稳定时预测效果会减弱;模型驱动方法的建模过程复杂且计算成本高昂,且模型可能不够完备;混合方法虽然能够解析大数据中的模式,但它要求大量的数据输入,并且在模型解释性和参数调优方面面临挑战,需要避免过度拟合的问题;因此,需要设计一种基于局部均值分解和sma-transformer的数据预测方法来解决上述问题。
技术实现思路
1、本发明所要解决的技术问题是提供一种基于局部均值分解和sma-transformer的数据预测方法,旨在精确调度能源,提升能效同时减少排放,并通过智能化的故障侦测及快速响应,鼓励用户参与能源管理,进一步推动智能控制系统的发展。
2、为实现上述技术效果,本发明所采用的技术方案是:
3、一种基于局部均值分解和sma-transformer的数据预测方法,包括以下步骤:
4、s1,采集transformer模型构建所需的数据,并构建数据集;
5、s2,对经过步骤s1处理过后的有源低压配网户变关系数据进行局部均值lmd分解,分解为多个成绩函数pf分量;
6、lmd信号分解算法可以自适应地将复杂的非平稳信号分解成一系列的乘积函数product function,pf;在该算法中,每个乘积函数都具有明确的物理意义,其中包络信号表示瞬时幅值函数,而纯调频信号则可以用来求得瞬时频率;通过lmd算法,复杂的非平稳信号可以被分解为这些具有明确物理意义的乘积函数pf;
7、s3,利用黏菌优化算法sma寻找transformer神经网络的最佳参数,通过使用sma迭代寻优,达到迭代次数后将此时的最优参数作为transformer神经网络的初始权值和阈值;
8、s4,利用transformer单独预测步骤s2得到的各个pf分量,对各个预测值进行叠加得到预测值。
9、优选地,步骤s1中,采集模型构建所需的数据,并构建数据集包括:
10、s101,采集有源低压配网户变关系数据,包括户变容量、用电类型和用电量;并进行数据清洗和去重,以确保数据的准确性和完整性;
11、数据清洗包括对数据中错误、不完整及不准确的内容进行识别和处理,处理包括处理缺失值、异常值,以及纠正错误的数据格式和处理重复数据;对于缺失值,通过填充、删除或者插值进行处理;对于异常值,通过统计分析判断并进行处理;
12、数据去重包括对数据集中重复的记录进行识别和移除,以确保数据集中的每条记录都是唯一的,重复的记录可能会对数据分析和建模造成干扰;
13、s102,将经过清洗和去重的数据按照预先定义的数据字段结构导入到excel文件中,同时进行数据格式规范化和标准化;
14、s103,对步骤s102导入的数据进行时间编码,为有源低压配网户变关系数据添加时间戳,作为后续transformer神经网络的输入;
15、s1031,时间戳转换:
16、对于每个时间戳,将其转换为unix时间戳,秒数;从获得的有源低压配网户变关系数据中进行时间戳提取,例如从2020年1月1日以来的每个秒数表示时间;
17、s1032,相对时间编码:对于每个时间点,计算其与数据集中的起始时间点之间的时间间隔,以k分钟为一个时间单位,将每个时间点表示为相对起始时间的k分钟数,作为相对时间编码的输入;k分钟优选15分钟;
18、s104,获得带有时间编码信息的有源低压配网户变关系数据,完成数据集构建。
19、优选地,步骤s2中,对经过步骤s1处理过后的有源低压配网户变关系数据进行局部均值lmd分解的步骤包括:
20、s201,将有源低压配网户变关系数据作为输入信号x(t),计算其均值函数m11(t):
21、分析输入信号x(t),计算其包含的全部极值点pi,i=1,2,...,n;
22、计算输入信号x(t)的均值序列mi,其公式如下:
23、
24、式中,pi表示极值点,pi+1表示后一个极值点;
25、通过滑动平均法对均值序列mi构成的曲线进行平滑,得到输入信号x(t)的均值函数m11(t);
26、s202,计算输入信号x(t)的包络估计函数a11(t):
27、计算输入信号x(t)的包络估计值ai:
28、
29、通过滑动平均法对包络估计值ai构成的曲线进行平滑,得到输入信号x(t)的包络估计函数a11(t);
30、s203,由输入信号x(t)减去均值函数m11(t),得到其输入信号x(t)的差值信号h11(t):
31、h11(t)=x(t)-m11(t);
32、式中,m11(t)通过步骤s201计算得出;
33、s204,计算输入信号x(t)的纯调频信号s1j(t):
34、对差值信号h11(t)进行幅度解调处理,得到s11(t):
35、
36、式中,h11(t)和a11(t)通过步骤s203和步骤s202计算得出;
37、重复上述步骤,并将s11(t)作为步骤s201中的输入信号x(t),令其为x1(t),重复步骤s201到步骤s203,直到整个过程执行j次迭代,当步骤s202得到的包络函数a1j(t)=1时,此时计算出纯调频信号s1j(t);
38、s205,将步骤s202中计算得到的包络估计函数a11(t)相乘,得到输入信号x(t)的幅值函数a1(t):
39、
40、式中,a1n(t)表示第j次迭代计算出的包络估计函数;
41、s206,计算输入信号x(t)的第一个pf分量f1(t):
42、f1(t)=a1(t)*s1j(t);
43、s207,计算输入信号x(t)的第一个残留分量u1(t):
44、u1(t)=x(t)-f1(t);
45、s208,计算输入信号x(t)的所有l个pf分量,令x(t)=u1(t),将其作为步骤s201的输入,重复执行步骤s207到步骤s208,直到获得n个pf分量,即fn(t),n=1,2,...,n,并且当残留分量u(t)为一个单调函数的时候,停止迭代,此时输入信号x(t)为:
46、
47、其中,fn(t),n=1,2,...,n表示经lmd分解之后的有源低压配网户变关系数据的n个pf分量;
48、s209,将步骤s208得到的pf分量作为后续网络的输入函数,从而进行预测。
49、优选地,步骤s3中,利用sma寻优算法来寻找transformer神经网络最优参数,其具体过程如下所示:
50、s301,初始化种群,并设定优化算法的参数,例如种群大小n、最大迭代次数maxt;
51、s302,计算种群中每个个体的适应度值,并进行排序;
52、s303,对黏菌种群的位置进行更新,并且更新权重;
53、s304,根据种群的适应度值,更新最优位置以及计算当前最优位置;
54、s305,判断当前是否满足最优条件,如果满足则输出最优结果;如果不满足,则回到步骤s302继续迭代优化过程,直至满足最优条件为止,输出transformer神经网络对应的最优参数。
55、优选地,步骤s4中,利用transformer单独预测步骤s2得到的各个pf分量,对各个预测值进行叠加得到预测值包括:
56、s401,输入表示:将步骤s104处理后的带有时间编码信息的有源低压配网户变关系数据按照固定的时间窗口或序列长度进行切分,形成输入序列,每个时间步的数据作为输入向量;
57、s402,位置编码:对步骤s401处理后的序列中的每个时间步进行位置编码,以便模型能够区分不同时间步之间的顺序关系,位置编码可以采用不同的方式,如使用固定的公式计算位置编码向量,或者通过学习得到位置编码;
58、s403,编码器-解码器结构:构建transformer模型的编码器-解码器结构,编码器部分负责将步骤s402的序列进行编码和抽象表示,解码器部分则负责将编码表示转化为预测输出,这个结构允许模型在学习时序数据中的长期依赖关系;
59、s404,自注意力计算:在编码器和解码器中使用自注意力机制来计算每个时间步的表示与其他时间步的关联度,自注意力机制帮助模型捕捉输入序列中不同时间步之间的依赖关系和重要模式;
60、s405,解码器预测:在解码器中,利用已知的历史数据和上下文信息,结合自注意力计算得到的上下文向量,进行时序预测,通过解码器的预测输出,可以得到未来若干时间步的预测结果;
61、s406,训练和优化:使用步骤s403处理后的数据对模型进行训练,并通过步骤s3中的sma寻优算法来优化模型参数,使模型能够更准确地进行时序预测;
62、s407,将预测值p与真实值z进行比较,采用平均绝对百分比误差(mean absolutepercentage error,mape)作为误差函数,误差达到阈值后,输出预测值,公式如下:
63、
64、式中,p表示预测值,z表示真实值。
65、本发明提供的基于局部均值分解和sma-transformer的数据预测方法的有益效果如下:
66、1,在数据分解阶段采用lmd算法,将有源低压配网户变关系数据自适应分解为一系列乘积函数pf分量,能有效解决分平稳信号的影响;
67、2,预测阶段选用时序预测表现较好的transformer网络,transformer在时序预测中的优势在于能够处理长期依赖关系,具有全局感知能力,并且具备较强的并行计算能力,使得其能够更有效地捕捉时序数据中的规律和模式,提高预测准确性;
68、3,选用sma全局寻优算法,一种基于黏菌寻找食物的行为特征而发展出的一种优化算法,模拟了黏菌在寻找食物过程中的行为,全局寻优能力优秀,有效防止陷入局部最优。
1.一种基于局部均值分解和sma-transformer的数据预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于局部均值分解和sma-transformer的数据预测方法,其特征在于,步骤s1中,采集模型构建所需的数据,并构建数据集包括:
3.根据权利要求1所述的一种基于局部均值分解和sma-transformer的数据预测方法,其特征在于,步骤s2中,对经过步骤s1处理过后的有源低压配网户变关系数据进行局部均值lmd分解的步骤包括:
4.根据权利要求1所述的一种基于局部均值分解和sma-transformer的数据预测方法,其特征在于,步骤s3中,利用sma寻优算法来寻找transformer神经网络最优参数,其具体过程如下所示:
5.根据权利要求1所述的一种基于局部均值分解和sma-transformer的数据预测方法,其特征在于,步骤s4中,利用transformer单独预测步骤s2得到的各个pf分量,对各个预测值进行叠加得到预测值包括:
