本发明属于人工智能和深度学习领域,具体涉及一种基于时序深度学习的草地生态指数预测方法及系统。
背景技术:
1、
2、植被作为草地生态系统的主要组成部分,是生态系统存在的基础,在陆地表面能量交换、生物地球化学和水文循环过程中扮演着重要的角色。草地植被覆盖度是反映草地生长状况和衡量生态系统的重要参量,在受荒漠化影响的干旱和半干旱地区,更是指示土地退化和沙漠化的一个敏感指标,对区域生态系统稳定及环境变化具有重要的影响。因此及时准确监测草地植被覆盖度,对当地草地资源的可持续利用、经济的可持续发展及生态系统的恢复与重建具有重要意义。植被覆盖度的监测方法主要包括地面测量和遥感监测两种。地面测量方法易受时间、天气和交通等状况的影响,很难在大范围内开展。
3、遥感监测方法需要依赖大量专业技术人员操作专用软件处理卫星影像数据,反演生成草场盖度、长势专题图,预测草原返青、枯黄时间等专题图,遥感监测工作需要大量的人力和时间进行人工数据处理,不仅耗时耗力、容易产生误差且精度不高,从应用角度现有技术通常依赖于人工经验或简单的统计模型,无法充分挖掘遥感数据中的潜在信息,预测结果不够准确和可靠。另外,遥感监测方法还存在遥感数据时空分辨率低与地面数据匹配性差等问题,影响植被覆盖度的估算精度。
4、随着人工智能的发展,人们开始将基于深度学习的计算机视觉技术应用于卫星影像数据的自动处理,如卷积神经网络(cnn)、循环神经网络(rnn)、长短期记忆网络(lstm)、生成对抗网络(gan)和注意力机制(attention mechanism)。但到目前为止,在图像时序预测领域,现有网络模型在进行时序预测时对于多维数据往往无法提取更深层的特征,进而导致预测结果不够精准与实际数据误差较大;而可以提取深层特征的网络模型虽然在许多任务中表现出色,但在时序预测方面,这类模型可能会在学习过程中丢失一些关键的时序信息,导致预测效果不佳。
技术实现思路
1、为解决专业技术人员操作专用软件处理卫星影像数据耗时耗力且容易产生误差以及现有深度学习模型在图像时序预测领域效果不佳的问题,本发明提供一种基于深度学习的草地生态预测方法及系统,其中时序预测模型的网络结构为结合了三维时序特征提取模块(3d-timesblock)模块与长方体注意力机制的层级编码-解码架构,系统为集合前后端、数据库搭建的监测平台。
2、本发明一个方面给出一种基于深度学习的草地生态预测方法,包括如下步骤:
3、s10、采集卫星遥感影像数据并进行遥感预处理,提取草地类型数据并进行分析计算得到地表植被指数;
4、s20、引入草地生态系统相关影响因子,包括降水量、温湿度、光照条件和土壤条件,然后对地表植被指数和草地生态系统相关影响因子进行数据预处理和数据清洗后,构建时序数据集;
5、s30、结合3d-timesblock模块与长方体注意力机制构建层级编码-解码架构的时序预测模型,所述时序预测模型包括输入层、3d-timesblock层、采样层、长方体注意力模块、编码嵌入层、输出层,并将所述时序数据集输入时序预测模型中进行训练,获取预测结果,最后采用均方误差(mse)、平均绝对误差(mae)和结构相似性指标(ssim)对预测结果进行验证,以确保模型性能的稳定;
6、s40、将训练好的深度学习时序预测模型部署在服务器端并创建应用程序编程接口(application programming interface,简称api);
7、s50、搭建草地生态监测平台前后端,对数据库建模设计,并在后端调用部署好的模型接口,经过模型处理后输出草地生态预测结果。
8、进一步的,所述步骤s10还包括如下步骤:
9、s101、采集多源卫星遥感影像数据;优选的,多源卫星遥感影像数据包括高分系列卫星、landsat系列卫星以及modis系列卫星等;深度学习时序预测模型通常需要大量的高质量数据进行训练,而多源卫星遥感数据具有不同卫星、不同波段和不同分辨率的特点,能够丰富数据的多样性和覆盖范围,提高数据的质量和准确性;此外,多源卫星遥感影像数据还可以应对云遮挡导致的部分数据缺失,增强数据集的完整性和可用性;
10、s102、对多源卫星遥感影像数据进行遥感预处理,包括辐射标定、几何校正、大气校正、影响配准、镶嵌、研究区裁剪操作;
11、s103、arcgis软件常用于地理空间数据的管理、分析、可视化和共享,在arcgis中使用全国土地利用数据对原始卫星遥感影像遥感数据中的草地土地类型进行提取;
12、s104、多源卫星遥感影像数据拥有多波段数据,因此,可以利用其特性,选取与植被高度相关的波段,计算归一化植被指数(ndvi)、植被覆盖度(fvc)、以及植被增强指数(evi),作为步骤s20中的数据集的主要输入;其中,
13、ndvi计算公式为:
14、
15、其中,nir表示近红外波段的反射值,red表示红外波段的反射值;
16、evi计算公式为:
17、
18、其中,nir表示近红外波段的反射值,ndvisoil表示研究区域内裸土或最小植被覆盖情况下的ndvi值,ndviveg表示在研究区域内植被完全覆盖情况下的ndvi值;
19、evi计算公式为:
20、
21、其中,nir表示近红外波段的反射值,red表示红外波段的反射值,blue表示可见光蓝波段的反射值,l表示大气校正参数(通常为1),c1表示大气校正参数,c2表示大气校正参数,g表示增益因子(通常为2.5)。
22、进一步的,所述步骤s20包括如下步骤:
23、s201、将计算得到的地表植被指数转换为灰度图,然后对地表植被指数和草地生态系统相关影响因子进行归一化处理,使数据映射到区间[-1,1]之间,如下公式所示:
24、
25、其中,x是输入数据;xnorm是标准化后的数据;min(x)是数据集中的最小值;max(x)是数据集中的最大值;
26、s202、接着对预处理之后的数据进行清洗,去除异常数据与无效数据,并根据时序关系对缺失值进行填补,最后基于数据集的复杂度,构建多维时序数据集。
27、进一步的,所述步骤s30还包括如下步骤:
28、s301、输入层接收原始的时序数据作为模型的输入;
29、s302、3d-timesblock层负责对输入数据进行特征提取,通过将二维时间序列转换为三维张量表示时间序列映射至三维空间,并利用3d-cnn来捕获和融合多尺度的时间变化,这样能够更有效地捕获周期内和周期间的多种时间变化,为后续的处理提供了更加丰富和有效的特征表示,最后使用自适应聚合的方法将所有周期的特征按其权重加权求和,保持输入与输入的形状一致;
30、s303、下采样层通过降低数据的维度,减小了计算量,同时保留了输入数据中的重要特征,为模型的学习和泛化能力提供了便利;
31、s304、建立m层长方体注意力模块:长方体注意力模块能将数据切分为多个包含时间和空间信息的“立方体”,在这些立方体内执行注意力计算,集中分析局部时空特征,这样不仅可以保持对空间结构的关注,还可以捕捉时间序列动态,更加有效地识别复杂模式,增强全局上下文理解;在时序预测模型中应用了m层长方体注意力模块对特征进行分析;
32、s305、建立n层下采样和n×m层长方体注意力模块的特征提取模块:通过重复叠加n层下采样和n×m层长方体注意力模块,模型可以逐渐地提取更高层次、更抽象的特征,并且进一步增强模型对时序数据的理解和表征能力;
33、s306、初始位置编码嵌入:位置编码嵌入是一种编码技术,它为每个信息位生成一个向量,以便模型能够识别序列中的相对位置以便模型处理序列信息;
34、s307、上采样层用于增加数据的维度,通过反卷积操作恢复了数据的空间信息,为模型提供更多的上下文信息,有助于更精确地进行时序预测;
35、s308、建立n层上采样和n×m层长方体注意力模块的特征提取模块:这一部分与s305的结构类似,重复叠加n层上采样和n×m层长方体注意力模块,进一步加深了模型的层次结构和复杂度,增强了模型的非线性建模能力;
36、s309、输出层将模型学到的特征转化为最终的预测结果;
37、s3010、采用均方误差(mse)、平均绝对误差(mae)和结构相似性指标(ssim)对预测结果进行验证,以确保模型性能的稳定;
38、均方误差(mse)是衡量预测值与真实值之间差异的常用指标之一,其计算公式如下:
39、
40、其中,n是样本数量,yi是真实值,是预测值。mse计算了每个样本预测值与真实值之间的平方差,并求取平均值;
41、平均绝对误差(mae)也是衡量预测值与真实值之间差异的常用指标之一,其计算公式如下:
42、
43、其中,n是样本数量,yi是真实值,是预测值。mae计算了每个样本预测值与真实值之间的绝对差,并求取平均值;
44、结构相似性指标(ssim)是一种用于衡量两幅图像相似程度的指标,其计算公式如下:
45、
46、其中,x和y分别是两幅图像,μx和μy是图像x和y的均值,σx2和σy2是图像x和y的方差,σxy是图像x和y的协方差,c1和c2是常数,用于稳定数值计算。
47、进一步的,所述步骤s40包括如下步骤:
48、s401、创建flask应用:使用flask框架创建一个web应用加载训练好的模型;
49、s402、定义api路由:定义一个post请求来接收输入数据,指定http请求方法和对应的处理函数,并返回预测结果;
50、s403、数据预处理:定义数据预处理函数,将接收到的数据转换为模型所需的格式;
51、s404、部署服务:将flask应用部署到服务器上,使用反向代理服务器来管理和运行应用,以配置应用的并发连接数、负载均衡和安全性等;
52、s405、发送请求:客户端向部署的api发送http请求,并接收预测结果。
53、进一步的,所述步骤s50包括如下步骤:
54、s501、数据库:选择合适的数据库进行数据建模和设计,以存储模型预测出来的结果;
55、s502、前端:基于vue框架搭建用户界面,实现页面的设计和交互、数据的集中式管理和共享和后端接口进行数据交互等功能;
56、s503、后端:使用spring boot搭建后端应用,实现业务逻辑和数据处理、http请求的处理、数据的增删改查等功能;
57、s504、经过模型处理后输出草地生态预测结果通过前端以专题图方式进行展示,草地生态预测结果包括草原植被盖度、草原植被长势、草原植被返青;更优选的,通过前端还可以展示草原类型分布。
58、本发明另一个方面给出了一种草地生态预测系统用于执行上述基于深度学习的草地生态预测方法,所述草地生态预测系统包括集合前后端、数据库搭建的监测平台。
59、其中,草地生态预测系统的功能模块包括:草原类型分布专题图、草原植被盖度专题图、草原植被长势专题图、草原植被返青专题图。
60、草原类型分布专题图主要展示研究区草原类型分布情况,草原类型分布专题图包含多种草原类型概况如草甸草原、平草原、荒漠草原和高寒草原。
61、草原植被盖度专题图主要展示不同时间段研究区的草地植被覆盖度情况,草原植被盖度专题图的制作首先通过在前端页面上传研究区5-7月的月度时序数据作为时序预测模型的输入,经服务器上所部署的模型推理过后得到8-10月的月度盖度预测结果,即输出结果,之后加以配置样式文件得到预测月份的草原植被盖度专题图,根据预测结果制定相关畜牧管理决策。
62、草原植被长势专题图主要展示研究区在某一段时间内草地生长状况情况,草原植被长势专题图通过对研究区长时序盖度数据进行分析得到具体时间段内草原植被长势值,根据不同长势值制定相关畜牧管理决策。
63、草原植被返青专题图主要展示研究区内各年度大致返青日期。草原植被返青专题图通过对某年长时序盖度数据进行分析得到此年内大致返青期,依据返青期制定相关畜牧管理决策。
64、与现有技术相比,本发明的有益效果是:
65、本发明采用基于深度学习的草地生态预测方法,通过自动化处理数据并引入草地生态系统相关影响因子,网络结构中引入3d-timesblock模块与长方体注意力机制的层级编码-解码架构构建草地生态系统的时序预测模型,提高了处理效率和预测精度,全面考虑多个因素对草地生态的影响,使预测结果更加准确可靠,解决了现有技术需要大量的人力和时间进行人工数据处理,不仅耗时耗力、容易产生误差且精度不高的问题。而且深度学习技术的智能化应用能力可以使得预测模型不断优化,适应不同环境变化。整合的系统架构则提高了系统的效率和资源利用率,为草原生态保护和管理提供了更可靠的支持和服务。
66、本发明3d-timesblock模块不仅有效地捕捉了时间序列的周期性特征,还通过多尺度的特征提取和灵活的特征融合策略,增强了模型对复杂时间序列数据的理解和预测能力;长方体注意力机制将数据切分为多个包含时间和空间信息的“立方体”,并在这些立方体内执行注意力计算,集中分析局部时空特征,这样不仅保持对空间结构的关注,也捕捉时间序列动态,有效识别复杂模式,增强模型对全局上下的理解。因此,本发明还解决了现有预测模型的下列问题“在图像时序预测领域进行时序预测时对于多维数据往往无法提取更深层的特征,进而导致预测结果不够精准与实际数据误差较大,而可以提取深层特征的网络模型虽然在许多任务中表现出色,但在时序预测方面,这类模型可能会在学习过程中丢失一些关键的时序信息,导致预测效果不佳”。
1.一种基于深度学习的草地生态预测方法及系统,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于深度学习的草地生态预测方法,其特征在于,步骤s10包括:
3.根据权利要求1所述的基于深度学习的草地生态预测方法,其特征在于,步骤s20包括:
4.根据权利要求1所述的基于深度学习的草地生态预测方法,其特征在于,步骤s30包括:
5.根据权利要求1所述的基于深度学习的草地生态预测方法,其特征在于,步骤s40的包括:
6.根据权利要求1所述的基于深度学习的草地生态预测方法,其特征在于,步骤s50包括:
7.根据权利要求4所述的基于深度学习的草地生态预测方法,其特征在于,3d-timesblock层负责对输入数据进行特征提取,通过将二维时间序列转换为三维张量表示时间序列映射至三维空间,其中首先利用快速傅里叶变换对数据进行时域分析并转换到频域,以此来揭示数据中的周期性结构并发现不同频率的周期成分;
8.根据权利要求4所述的基于深度学习的草地生态预测方法,其特征在于,s304步骤包括:
9.一种草地生态预测系统,其特征在于,用于执行权利要求1~8任一项基于深度学习的草地生态预测方法,草地生态预测系统包括集合前后端、数据库搭建的监测平台。
10.一种草地生态预测系统,其特征在于,还包括如下功能模块:草原类型分布专题图、草原植被盖度专题图、草原植被长势专题图、草原植被返青专题图;