本发明涉及水质数据预测,尤其是涉及一种湖库型叶绿素浓度预测方法、装置和介质。
背景技术:
1、水体富营养化是指湖泊等在人类活动的影响下,由于水中营养盐的含量过多而导致水生生态系统失衡的现象。富营养化已经成为如今全世界大多数湖库水体所面临的主要问题,这是一种典型的水污染形式。叶绿素a是一个能够表征水体的富营养化和藻类生长的水质指标。因此,掌握湖库叶绿素a在长时间的时空变化规律,揭示驱动因素并进行预测预报对湖库风险预警和重点区域有效管理具有重要意义。
2、参数统计和生态动力学模型一直是对叶绿素进行建模的传统方法,在叶绿素a的模型预测方面已经进行了很多的研究。但是,现有模型对水动力条件的考虑还相当有限,往往会忽略水动力、光照等环境因素持续对水体运动及水体中物质分布造成的连续性影响,导致预测模型不能准确描述叶绿素a的变化趋势。
技术实现思路
1、本发明的目的就是为了克服上述现有技术存在的准确率低的缺陷而提供一种湖库型叶绿素浓度预测方法、装置和介质。
2、本发明的目的可以通过以下技术方案来实现:
3、一种湖库型叶绿素浓度预测方法,包括以下步骤:
4、s1:获取湖库的包含预测点位及上游点位的水质、水动力和气象的在线自动监测数据;
5、s2:对在线自动监测数据进行预处理,得到处理后的数据;
6、s3:对处理后的数据进行特征提取得到预测点位和上游点位的水质特征和水动力指标特征,并构建累积光照特征;
7、s4:将上游水质特征、水动力指标特征与光照特征输入预先训练的融合预测模型中,得到上游输移叶绿素预测结果和时序影响叶绿素预测结果,使用误差倒数法将上游输移叶绿素预测结果和时序影响叶绿素预测结果进行融合;
8、s5:融合预测模型输出融合得到的叶绿素预测结果。
9、进一步地,步骤s3包括以下步骤:
10、对处理后的数据中所有水质、水动力特征数据进行随机抽样,创建决策树;计算样本袋外数据的回归预测准确率对袋外数据特征xi施加随机扰动,计算第i个特征扰动后回归预测准确率计算xi的重要性pi,计算表达式为:
11、
12、式中,pi为第i个特征的重要性,k为训练样本的个数;
13、对pi降序排序得到特征重要性排序qi;然后构建模糊系统;将排序后的特征qi输入模糊系统,得到每个特征最终的模糊系统得分,依据模糊系统得分选取特征作为后续模型输入。
14、进一步地,累积光照特征的计算方法为:
15、记录累积时段的光照数据的倒序得到光照数据集,根据朗伯比尔公式计算浊度在r时刻对光照的影响,计算表达式为:
16、
17、式中,tar为r时刻的浊度影响强度,abs为吸光系数,tr为r时刻的浊度;
18、计算r时刻的时间权重,计算表达式为:
19、tsr=eα*(r-lag)
20、式中,tsr为时间权重,lag为滞后时间(h),α为时间权重因子;
21、计算除去滞后时间的累积光照,计算表达式为:
22、
23、式中,ar为累积光照,h为累积时段。
24、进一步地,融合预测模型包括informer模型和lstm模型,informer模型根据上游点位的水质特征、水动力指标特征得到上游输移叶绿素预测结果,lstm模型根据预测点位的水质特征、水动力指标特征和累积光照特征得到预测点位时序影响叶绿素预测结果。
25、进一步地,预先训练的融合预测模型的训练过程的具体步骤包括:
26、s401:将上游点位的水质特征、水动力指标特征输入informer模型得到上游输移叶绿素预测结果;
27、s402:将预测点位的水质特征、水动力指标特征和累积光照特征输入lstm模型得到时序影响叶绿素预测结果;
28、s403:将informer模型与lstm模型作为基训练模型,根据误差倒数法进行模型融合,得到融合预测模型。
29、进一步地,informer模型为优化后的informer模型,优化方法具体为:
30、步骤4011:构建时间特征编码,将时间数据根据不同周期进行分解,采用三角特征编码方式生成d时刻的特征编码:
31、
32、式中,z为时间分解方式,为z分解方式下的余弦特征编码,为z分解方式下的正弦特征编码,perz为z分解方式下的周期长度;
33、步骤4012:使用多尺度多层感知机处理输入的时间特征编码,分别处理为长时间特征集l、中时间特征集m和短时间特征集s,得到最终的多尺度融合特征:
34、
35、式中,nor为归一化算法,mlp为多层感知机操作,c为不同尺度特征集,表示拼接,f′lms为归一化后的融合特征,flms为最终的融合时间特征;
36、步骤4013:将得到的融合时间特征输入informer模型作为输入特征编码,得到优化后的informer模型。
37、进一步地,lstm模型为优化后的lstm模型,优化方法具体为:
38、步骤4021:将输入特征ti转化为对数收益率lti;
39、步骤4022:使用注意力机制优化lstm算法的信息获取;
40、获得lstm处理lti时获得的隐藏状态矩阵h=(hi-w,…,hi-1),利用一维卷积提取时间模式矩阵,计算表达式为:
41、
42、式中,c为滤波器,为第q个滤波器在p时刻提取的特征值,w为滤波器长度,l为卷积计算填充长度,w表示权重最大长度;
43、通过计算权重得到注意力公式:
44、
45、式中,ati为注意力向量,σ为sigmoid函数,wm为权重矩阵;
46、将ati与hi线性映射后相加得到最终的预测值;
47、步骤4023:使用粒子群算法优化lstm算法的时间步、学习率和与注意力机制中的滤波器长度;
48、构建粒子群算法,以时间步timestep、学习率lr和滤波器长度w构建维度空间d,随机生成np个粒子,其位置及速度用sz和vz(i=1,2,...,np)表示,适应度函数为lstm模型预测结果的纳什效率系数nse:
49、
50、其中,xobs,z为实际值,xmodel,z为预测值,为实际值的均值,np为数据量;
51、根据全部粒子的全局最优yz及个体粒子a的局部最优yza更新各个粒子的速度及位置:
52、vza(t+1)=ωvza(t)+c1r1(yza(t)-sza(t))+c2r2(yz(t)-sza(t))
53、sza(t+1)=sza(t)+vza(t+1)
54、其中t为迭代的次数,ω是惯性权重,c1和c2为学习因子,r1和r2为随机扰动因子;
55、使用粒子群算法进行迭代,直至达到终止条件,输出此时的时间步、学习率和滤波器长度;
56、步骤4023:将对数收益率与注意力向量、时间步、学习率和滤波器长度输入lstm模型,得到预测结果。
57、进一步地,根据误差倒数法进行模型融合的计算表达式为:
58、ff=wi*fi+wl*fl
59、
60、式中,fi为informer模型所得的上游输移叶绿素预测值,fl为lstm模型所得的时序影响叶绿素预测值,ff为融合后的最终预测值,wi、wl分别为informer模型和lstm模型的权重系数,εi、εl分别代表informer模型和lstm模型预测结果的误差。
61、本发明的第二方面,一种湖库型叶绿素浓度预测装置,包括存储器、处理器,以及存储于存储器中的程序,处理器执行程序时实现如上任一的一种湖库型叶绿素浓度预测方法。
62、本发明的第三方面,一种存储介质,其上存储有程序,程序被执行时实现如上任一的一种湖库型叶绿素浓度预测方法。
63、与现有技术相比,本发明具有以下有益效果:
64、1)本发明通过对水质、水动力和光照的在线自动监测数据进行了预处理,并进行了特征提取和数据清洗,提高数据预测精度,通过融合预测模型得到上游输移叶绿素预测结果和时序影响叶绿素预测结果,实现对上游和预测点位的水质、水动力和光照对叶绿素分布的非线性关系和时序影响的分析,提高数据平稳性,实现快速预测,同时能够精准预测较长时间的叶绿素数据。
65、2)本发明通过误差倒数法将informer与lstm模型进行融合,根据模型预测结果误差以不同权重组合,构建informer-lstm预测模型,有效的融合了上游与预测点位多个点位数据,并融合了两个模型的优点,进一步提高了预测模型的运算速度及预测精度。
66、3)本发明提出了累积光照算法,可以更加有效地对光照数据进行特征构建。
1.一种湖库型叶绿素浓度预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种湖库型叶绿素浓度预测方法,其特征在于,步骤s3包括以下步骤:
3.根据权利要求1所述的一种湖库型叶绿素浓度预测方法,其特征在于,所述累积光照特征的计算方法为:
4.根据权利要求1所述的一种湖库型叶绿素浓度预测方法,其特征在于,所述融合预测模型包括informer模型和lstm模型,所述informer模型根据上游点位的水质特征、水动力指标特征得到上游输移叶绿素预测结果,所述lstm模型根据预测点位的水质特征、水动力指标特征和累积光照特征得到预测点位时序影响叶绿素预测结果。
5.根据权利要求4所述的一种湖库型叶绿素浓度预测方法,其特征在于,所述预先训练的融合预测模型的训练过程的具体步骤包括:
6.根据权利要求5所述的一种湖库型叶绿素浓度预测方法,其特征在于,步骤s401中,所述informer模型为优化后的informer模型,优化方法具体为:
7.根据权利要求5所述的一种湖库型叶绿素浓度预测方法,其特征在于,步骤s402中,所述lstm模型为优化后的lstm模型,优化方法具体为:
8.根据权利要求5所述的一种湖库型叶绿素浓度预测方法,其特征在于,所述根据误差倒数法进行模型融合的计算表达式为:
9.一种湖库型叶绿素浓度预测装置,包括存储器、处理器,以及存储于所述存储器中的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中任一所述的一种湖库型叶绿素浓度预测方法。
10.一种存储介质,其上存储有程序,其特征在于,所述程序被执行时实现如权利要求1-8中任一所述的一种湖库型叶绿素浓度预测方法。
