本发明涉及台风预测相关,尤其涉及一种基于几何代数机器学习模型的台风强度预测方法。
背景技术:
1、台风是一种极具破坏性的自然灾害,通常由热带海洋上的热空气形成,带有强劲的风速和巨大的降雨量,会给全球沿海地区人民的生命财产安全造成巨大威胁。因此,准确预测台风强度对政府决策和人民提前避险具有重要现实意义。
2、传统的台风预测方法主要包括统计学模型、动力学模型以及动力学统计模型。统计学模型简单易用,但对非线性关系的捕捉能力较弱,存在无法覆盖统计以外的异常情况、预测精度不高等问题。动力学模型,基于空气动力学和热动力学原理,构建大气动力学方程,利用数学方程对台风运动进行建模,但该方法所建立方程复杂难以求出解析解,计算量大、成本高、不易推广。动力学统计模型能够更全面地考虑历史数据和物理过程,然而,因涉及大量的数据和复杂的模型参数,本质上仍需要耗费大量的计算资源。
3、台风动力学过程复杂,台风强度的变化受许多表现出非线性特征的环境变量所影响,为解决传统模型计算资源消耗大、不易推广问题,同时更好地捕捉台风的复杂非线性关系,前人将机器学习方法引入台风预测。虽然该方法能够有效地从多种与台风强度相关的数据中提取有效信息,从而提高预测的准确性,但是忽略了矢量场内部以及单个矢量场和标量场之间的几何关系。
技术实现思路
1、发明目的:本发明旨在提供一种基于几何代数机器学习模型的将多维信号转换为多向量捕捉内部序列特征之间的关系保持多维度间的相关性的台风强度预测方法。
2、技术方案:本发明所述的基于几何代数机器学习模型的台风强度预测方法,包括以下步骤:
3、(1)构建几何代数机器学习模型的训练数据集和验证数据集,对原始台风数据进行预处理和特征提取,得到二维特征数据集2d-tsdk和三维特征数据集3d-tsdk,并确定训练数据集、测试数据集和验证数据集;
4、(2)构建基于几何代数结合深度学习的clifford-cnn模型,包括:clifford conv模块、clifford linear模块、clifford batchnorm模块、clifford spatial attention模块、clifford fusion模块和cliffordwide anddeep模型模块;
5、(3)训练clifford-cnn模型,通过验证数据集由最小验证损失函数确定最优模型参数;
6、(4)向最优模型输入测试数据集,计算台风强度预测结果的平均绝对误差和均方根误差,评估台风强度预测方法的性能。
7、进一步的,步骤(1)具体如下:
8、获取时间t内预测区域的台风最佳路径数据集作为台风二维数据,采用cliper方法构建二维特征数据集2d-tsdk,将该二维特征数据集划分为训练集和验证集,并进行归一化处理,得到第一训练数据集x_wide_train、第一测试数据集x_wide_test、第一训练标签集y_train和第一测试标签集y_test;
9、考虑经向的风速向量、纬向的风速向量和压强,获取时间t内预测区域的再分析数据集作为风场三维数据,通过pandas库中的“isin”方法筛选出与2d-tsdk台风id匹配的行,并进行标准化和拼接,得到三维特征数据集3d-tsdk,分成第二训练数据集x_deep_train和第二测试数据集x_deep_test,第二训练标签集y_train和第二测试标签集y_test;
10、将第一训练数据集x_wide_train、第二训练数据集x_deep_train、第一训练标签集y_train和第二训练标签集y_train按照比例划分为训练数据集train_d和验证数据集val_d;其中,train_d包括n1个特征数据和n1个标签数据,val_d包括n2个特征数据和n2个标签数据。
11、进一步的,步骤(2)中,所述clifford conv模块的输入特征图卷积核其中输入特征图f包含标量、向量和双向量,卷积核w包括对应的多向量,g2表示clifford代数中的多向量空间;多向量卷积操作中使用几何乘积替代标量乘积,几何乘积为(fj(y)*wij(y-x)),其中fj(y)和wij(y-x))均为多向量;
12、cliffordconv模块的函数表达式为
13、y=clconv(x,k,g,stride,padding,dilation)
14、其中,y为输出结果,clconv表示cliffordconv操作,x为输入特征张量,k为卷积核张量,g为cliffordsignature张量,stride为卷积的步长,padding为边缘填充,dilation为卷积核元素间的间距。
15、进一步的,步骤(2)中,所述cliffordlinear模块结合线性变换和clifford代数在高维实现线性变换,该模块的函数表达为
16、y=cllinear(x,w,b,g)
17、其中函数cllinear表示clifford代数中的线性变换,w为权重张量,b为偏置向量,g为cliffordsignature张量。
18、进一步的,所述cliffordbatchnorm模块的函数表达为
19、y=clbatchnorm(x,μ,σ,w,b,training,momentum)
20、其中,clbatchnorm表示clifford批归一化操作函数,μ为运行均值向量,σ为运行协方差张量,w为权重张量,b为偏置向量,training是一个布尔值参数,指示是否在训练模式下使用运行中的均值和方差,momentum为运行均值和方差的动量。
21、进一步的,步骤(2)中,所述clifford spatialattention模块用于自动识别高响应风速区域,该模块的第一层为cliffordconv层;第二层为cliffordbatchnorm层,用于对通道进行归一化;第三层为修正线性单元relu激活函数层;第四层为cliffordconv层;第五层为cliffordbatchnorm层;第六层为sigmoid激活函数层。
22、进一步的,步骤(2)中,所述cliffordfusion模块用于将主干网络和分支网络在不同层次上提取的特征信息进行融合;该模块的函数表达为
23、z=f(concat(m,n))
24、其中,z为融合结果,f(·)表示cliffordfusion运算符,concat(·)函数表示m和n在通道维度上串联,m和n分别为主干网络和分支网络的特征图。
25、进一步的,步骤(2)中,所述cliffordwide anddeep模型模块的函数表达为
26、predictions=f(w,d)
27、其中,predictions为预测结果,f为cliffordwide anddeep模型函数,w代表wide部分的参数和结构,wide部分负责捕获数据中的线性关系;d代表deep部分的参数和结构,deep部分负责学习数据中的非线性特征。
28、进一步的,步骤(3)中,clifford-cnn模型训练过程如下:
29、将3d-tsdk进行第一次clifford conv操作、relu激活函数和最大池化操作,得到第一特征图feature1,对feature1进行第一次cliffordfusion操作和cliffordspatialattention操作,得到第一图像image1,对feature1进行第二次clifford conv操作、relu激活函数和最大池化操作得到第二特征图feature2。将feature2和image1进行第二次cliffordfusion操作和clifford spatialattention,得到第二图像image2。
30、对feature2进行第三次clifford conv操作、relu激活函数和最大池化操作,得到第三特征图feature3,将feature3和image2进行第三次cliffordfusion操作和cliffordspatial attention操作,得到第三图像image3,重塑形状后进行clifford linear操作,再加权融合得到deep特征;
31、将wide特征和deep特征输入cliffordwide and deep模型,进行两次全连接操作后得到预测结果,即模型预测结果。
32、进一步的,步骤(3)中,损失函数l1loss:
33、
34、其中,n1为train_d的输入数据或标签数据的总个数,if为train_d中的序号,1≤if≤n1,为第if个特征的预测的标签数据,是第if真实的标签数据。
35、有益效果:本发明与现有技术相比,其显著优点是:1、本发明引入了基于几何代数的卷积神经网络,并结合空间注意力机制,以增强对台风强度的预测,与中国气象局的传统预报方法相比,本发明提出的几何代数神经网络模型提高了约9%的预测精度,与实值神经网络模型相比,均方根误差降低了约5%;2、本发明提出的几何代数神经网络在保持预测性能的同时,大幅减少了模型参数的数量,与实值神经网络相比减少了四倍之多;3、本发明结合广义线性模型和深度神经网络模型构建cliffordwide and deep模型模块,wide部分使用线性模型处理输入特征,应用线性变换,计算线性模型的预测结果,用于捕捉输入特征之间的稀疏交互关系,deep部分通过多层的非线性变换和激活函数,能够学习到数据中的高阶特征交互关系,cliffordwide anddeep模型同时优化wide部分和deep部分的参数,使得模型能够充分利用线性和非线性特征之间的关系,提高模型的泛化能力;4、本发明的clifford conv模块将传统卷积神经网络中的标量操作扩展为多向量操作,卷积操作中几何乘积替代标量乘积,几何乘积结合内积和外积,可以捕捉更多的几何信息,考虑了矢量场内部以及单个矢量场和标量场之间的几何关系。
1.一种基于几何代数机器学习模型的台风强度预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述基于几何代数机器学习模型的台风强度预测方法,其特征在于,步骤(1)具体如下:
3.根据权利要求2所述基于几何代数机器学习模型的台风强度预测方法,其特征在于,步骤(2)中,所述clifford conv模块的输入特征图卷积核其中输入特征图f包含标量、向量和双向量,卷积核w包括对应的多向量,g2表示clifford代数中的多向量空间;多向量卷积操作中使用几何乘积替代标量乘积,几何乘积为(fj(y)*wij(y-x)),其中fj(y)和wij(y-x))均为多向量;
4.根据权利要求3所述基于几何代数机器学习模型的台风强度预测方法,其特征在于,步骤(2)中,所述cliffordlinear模块结合线性变换和clifford代数在高维实现线性变换,该模块的函数表达为
5.根据权利要求4所述基于几何代数机器学习模型的台风强度预测方法,其特征在于,步骤(2)中,所述cliffordbatchnorm模块的函数表达为
6.根据权利要求5所述基于几何代数机器学习模型的台风强度预测方法,其特征在于,步骤(2)中,所述clifford spatialattention模块用于自动识别高响应风速区域,该模块的第一层为cliffordconv层;第二层为cliffordbatchnorm层,用于对通道进行归一化;第三层为修正线性单元relu激活函数层;第四层为cliffordconv层;第五层为cliffordbatchnorm层;第六层为sigmoid激活函数层。
7.根据权利要求6所述基于几何代数机器学习模型的台风强度预测方法,其特征在于,步骤(2)中,所述cliffordfusion模块用于将主干网络和分支网络在不同层次上提取的特征信息进行融合;该模块的函数表达为
8.根据权利要求7所述基于几何代数机器学习模型的台风强度预测方法,其特征在于,步骤(2)中,所述cliffordwide and deep模型模块的函数表达为
9.根据权利要求8所述基于几何代数机器学习模型的台风强度预测方法,其特征在于,步骤(3)中,clifford-cnn模型训练过程如下:
10.根据权利要求9所述基于几何代数机器学习模型的台风强度预测方法,其特征在于,步骤(3)中,损失函数l1loss: