一种遥感场景分类方法、系统、存储介质及设备

    技术2025-03-29  45


    本发明涉及遥感,具体涉及一种遥感场景分类方法、系统、存储介质及设备。


    背景技术:

    1、随着卷积神经网络(cnn)模型在计算机视觉(cv)领域取得的巨大成功,基于cnn的遥感场景分类模型已经成为当前的主流模型之一,学者们提出了众多的基于cnn方法进行遥感场景分类。接着,学者们提出了一种新的基于深度学习框架的transformer,并应用于cv领域。由于transformer中的注意力机制能够有效计算全局长序列输入并学习它们之间的依赖关系,因此,最近学者提出了许多基于transformer的遥感场景分类模型。

    2、虽然上述模型取得了较好的分类结果,但是此类模型也存在如下的不足:(1)由于基于transformer的遥感场景分类模型缺少卷积使得归纳偏差,相较于cnn模型则需要更多的数据集,因此在数量较少的数据集上其性能相比于cnn模型稍差。(2)基于transformer的遥感场景分类模型在模型参数数量和计算量等方面相比于cnn模型更大、更复杂,因此在一些资源受限的场景中,其鲁棒性较弱。(3)虽然基于transformer的遥感场景分类模型可以有效捕捉全局信息,但是也可能丢失场景中关键局部信息。由此可见,基于cnn的场景分类模型仍然是研究的重要方向之一。

    3、上述模型和方法都取得了较好的结果,但它们仍然存在挑战:(1)一些基于cnn的模型主要关注场景的高级特征,忽略了场景的浅层特征(即底层和中层特征),且主要关注hrrsi中的高层语义特征,忽略了多源数据中包含的有效特征信息,容易造成一些几何结构和空间布局相同或者相似的场景混淆。例如相同结构和空间布局的两栋办公楼,其中一栋各层中均为各类企业办公用地,而另一栋各层中均为各类服务机构,现有模型很难区分这些场景的类别。(2)虽然部分模型使用卷积可以较好地拟合hrrsi中的统计数据,但也可能阻止模型获取全局上下文信息,复杂空间分布场景中的全局上下文信息和局部信息对场景分类都是非常重要的。(3)一些基于cnn的模型通常采用连续的卷积来覆盖hrrsi,但实际上cnn中的感受野比理论感受野要窄,且使用大核卷积也会增加模型的参数和计算复杂度,因此模型的分类准确度和模型复杂度难以达到有效平衡。


    技术实现思路

    1、针对现有技术的不足,本发明的目的在于提供一种遥感场景分类方法、系统、存储介质及设备,旨在解决现有技术中遥感场景分类准确度与模型复杂度难以达到有效平衡的问题,从而能够在降低模型复杂度的情况下提升遥感场景的分类准确性。

    2、本发明的第一方面在于提供一种遥感场景分类方法,所述方法包括:

    3、获取高分辨率遥感影像数据与多源数据,基于所述高分辨率遥感影像数据与多源数据提取遥感场景特征,采用李群区域协方差特征矩阵对所述遥感场景特征进行表征;

    4、采用并行扩张大核卷积操作提取所述高分辨率遥感影像数据中长距离特征信息的多层多尺度特征,并利用基于李群内均值的特征级融合方式对所述多层多尺度特征进行压缩;

    5、采用局部通道分离与聚合方式获取通道的短距离特征信息,以表征通道之间的依赖关系,从而根据所述依赖关系对所述遥感场景进行分类。

    6、根据上述技术方案的一方面,获取高分辨率遥感影像数据与多源数据,基于所述高分辨率遥感影像数据与多源数据提取遥感场景特征,采用李群区域协方差特征矩阵对所述遥感场景特征进行表征的步骤,包括:

    7、分别获取高分辨率遥感影像数据与多源数据;

    8、基于所述高分辨率遥感影像数据与所述多源数据,获取遥感影像中各种遥感场景的纹理特征、形状特征、紧凑性特征,以及遥感场景中目标对象的内部社会经济语义特征,得到遥感场景特征;

    9、采用李群区域协方差对所述遥感场景特征进行表征。

    10、根据上述技术方案的一方面,获取遥感场景中目标对象的内部社会经济语义特征的步骤,包括:

    11、获取所述遥感场景中与所述目标对象对应的社交媒体信息与志愿地理信息;

    12、根据所述社交媒体信息与所述志愿地理信息,识别所述目标对象的类别信息,以根据所述类别信息确定内部社会经济语义特征。

    13、根据上述技术方案的一方面,采用并行扩张大核卷积操作提取所述高分辨率遥感影像数据中长距离特征信息的多层多尺度特征,并利用基于李群内均值的特征级融合方式对所述多层多尺度特征进行压缩的步骤,包括:

    14、基于预设的全局自注意力模块将特征图沿着通道维度划分成4个部分,得到第一通道、第二通道、第三通道与第四通道,所述第一通道与所述第三通道分别表示低频特征与高频特征;

    15、对所述第二通道与所述第三通道采用全局深度卷积自适应池化操作以模拟全局上下文关键特征,并利用所述全局上下文关键特征校准每个通道的权重值,以实现特征的自适应选择;

    16、将校准后的权重值对应添加至所述第一通道的低频特征与第四通道的高频特征中,以通过特征复用实现不同分区部分的特征信息交互;

    17、采用基于李群内均值的特征级融合方式对所述多层多尺度特征进行压缩。

    18、根据上述技术方案的一方面,采用局部通道分离与聚合方式获取通道的短距离特征信息,以表征通道之间的依赖关系,从而根据所述依赖关系对所述遥感场景进行分类的步骤,包括:

    19、采用预设的局部自注意力模块通过通道拆分与融合方式,对不同通道中的特征信息与空间注意力相互结合;

    20、输出特定遥感场景中关键区域的特征信息,并忽略非相关区域的特征信息,以增强复杂空间分布的语义特征信息,得到短距离特征信息以表征通道之间的依赖关系;

    21、根据所述依赖关系对所述遥感场景进行分类。

    22、根据上述技术方案的一方面,采用预设的局部自注意力模块通过通道拆分与融合方式,对不同通道中的特征信息与空间注意力相互结合的步骤,包括:

    23、基于预设的局部自注意力模块进行层归一化操作,将特征图沿着通道划分成若干个特征部分;

    24、在模型训练过程中获取所述特征部分的特定语义响应,生成与所述特征部分对应的空间注意力;

    25、采用逐点多层感知模块对所述特征部分的特征进行通道建模,以增强通道维度空间的特征融合,并将得到的融合特征进行连接,以用于表征高效的空间描述符;

    26、通过3×3的并行扩张卷积操作,使每个特征部分均增加一对参数以移动不同部分的权重值;

    27、通过李群sigmoid激活函数和通道聚合生成空间注意力特征值,以增强各个特征部分的信息交换,采用残差连接所有特征部分以使不同通道中的特征信息与空间注意力相互结合。

    28、本发明的第二方面在于提供一种遥感场景分类系统,应用于上述技术方案当中所述的方法,所述系统包括:

    29、数据表征模块,用于获取高分辨率遥感影像数据与多源数据,基于所述高分辨率遥感影像数据与多源数据提取遥感场景特征,采用李群区域协方差特征矩阵对所述遥感场景特征进行表征;

    30、特征提取模块,用于采用并行扩张大核卷积操作提取所述高分辨率遥感影像数据中长距离特征信息的多层多尺度特征,并利用基于李群内均值的特征级融合方式对所述多层多尺度特征进行压缩;

    31、场景分类模块,用于采用局部通道分离与聚合方式获取通道的短距离特征信息,以表征通道之间的依赖关系,从而根据所述依赖关系对所述遥感场景进行分类。

    32、根据上述技术方案的一方面,所述数据表征模块具体用于:

    33、分别获取高分辨率遥感影像数据与多源数据;

    34、基于所述高分辨率遥感影像数据与所述多源数据,获取遥感影像中各种遥感场景的纹理特征、形状特征、紧凑性特征,以及遥感场景中目标对象的内部社会经济语义特征,得到遥感场景特征;

    35、采用李群区域协方差对所述遥感场景特征进行表征。

    36、本发明的第三方面在于提供一种可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述技术方案当中所述方法的步骤。

    37、本发明的第四方面在于提供一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述技术方案当中所述方法的步骤。

    38、与现有技术相比,采用本发明所示的遥感场景分类方法、系统、存储介质及设备,有益效果在于:

    39、通过从多源数据的角度关注hrrsi中关键特征信息和优化特征表征空间、全局自注意力机制和局部自注意力机制三个方面来设计遥感场景分类模型。首先,结合hrrsi自身的特点和多源数据(例如社交媒体和志愿地理数据)选择性地关注了影像中重要特征信息,并采用高效的李群区域协方差特征矩阵进行表征。然后,设计了全局自注意力机制,采用并行扩张大核卷积取代了传统卷积,能在更大的感受野下自适应地提取更丰富的空间上下文特征信息,并采用了自适应聚合操作来自适应全局的环境,结合全局上下文特征信息对每个通道的权重进行重新校准。作为全局自注意力机制的补充,在局部自注意力机制中,采用了通道分离和聚合的方式,捕获通道间的特征关系。该机制主要是用来模拟局部空间的依赖关系,有选择性地关注重点区域的特征,并且忽略不相关的区域,在空间维度上捕获和增强每个特征组的不同语义分布。在四个广泛使用且具有挑战性的数据集上的实验表明,本发明提出的模型相比于其他通用的模型具有一定的竞争力。


    技术特征:

    1.一种遥感场景分类方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的遥感场景分类方法,其特征在于,获取遥感场景中目标对象的内部社会经济语义特征的步骤,包括:

    3.根据权利要求1所述的遥感场景分类方法,其特征在于,采用并行扩张大核卷积操作提取所述高分辨率遥感影像数据中长距离特征信息的多层多尺度特征,并利用基于李群内均值的特征级融合方式对所述多层多尺度特征进行压缩的步骤,包括:

    4.根据权利要求3所述的遥感场景分类方法,其特征在于,采用局部通道分离与聚合方式获取通道的短距离特征信息,以表征通道之间的依赖关系,从而根据所述依赖关系对所述遥感场景进行分类的步骤,包括:

    5.根据权利要求4所述的遥感场景分类方法,其特征在于,采用预设的局部自注意力模块通过通道拆分与融合方式,对不同通道中的特征信息与空间注意力相互结合的步骤,包括:

    6.一种遥感场景分类系统,其特征在于,应用于权利要求1-5任一项所述的方法,所述系统包括:

    7.根据权利要求6所述的遥感场景分类系统,其特征在于,所述数据表征模块具体用于:

    8.一种可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1-5任意一项所述方法的步骤。

    9.一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5任意一项所述方法的步骤。


    技术总结
    本发明公开了一种遥感场景分类方法、系统、存储介质及设备,该方法包括:获取高分辨率遥感影像数据与多源数据,基于高分辨率遥感影像数据与多源数据提取遥感场景特征,采用李群区域协方差特征矩阵对遥感场景特征进行表征;采用并行扩张大核卷积操作提取高分辨率遥感影像数据中长距离特征信息的多层多尺度特征,并利用基于李群内均值的特征级融合方式对多层多尺度特征进行压缩;采用局部通道分离与聚合方式获取通道的短距离特征信息,以表征通道之间的依赖关系,从而根据依赖关系对遥感场景进行分类。本发明解决了遥感场景分类准确度与模型复杂度难以达到有效平衡的问题,能够在降低模型复杂度的情况下提升遥感场景的分类准确性。

    技术研发人员:徐承俊,舒静倩,汪政罕,汪嘉麟
    受保护的技术使用者:江西师范大学
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-28327.html

    最新回复(0)