本发明属于图像处理领域,具体涉及一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法。
背景技术:
1、随着信息时代的发展,一个事物往往需要从多个视角进行表征,从而增加对事物描述的准确性。例如,一则新闻可以由不同的机构以及不同的文字进行描述,一张图片也可以由不同的颜色、纹理、形状等特征进行描述。因此,近年来对图像聚类问题的研究也由传统的单视图视角逐渐往多视图视角进行发展。由于描述图像的视图增多,图像间的相似性信息变得更丰富,单视图聚类方法缺少对多个视图相似信息的整合,导致聚类性能较差。而多视图聚类方法融合不同视图的相似信息,能显著提高聚类的精度和鲁棒性。根据不同的数据表示类型,多视图聚类可分为:(1)多核聚类;(2)深度多视图聚类;(3)多视图子空间聚类;(4)基于图的多视图聚类。
2、多核聚类将核函数引入到聚类分析中,利用各关键在于如何有效利用不同核函数的优势以提高不同规模、不同场景下数据的聚类性能。基于图学习的多视图聚类方法旨在寻找一个由所有视图共享,且能够刻画所有视图相互关系的融合图,然后在融合图上使用图切割算法或其他谱图技术,获取最终聚类结果。该类算法主要分为三个关键步骤:(1)基于单视图分别构造初始图;(2)学习融合全部视图拓扑结构的一致图;(3)将聚类问题转化成图分割问题。hao等将所有视图的相似图矩阵进行融合,生成统一的图矩阵,统一图矩阵又同步更新每个视图的相似图矩阵。通过这种方式能帮助每个视图的相似图矩阵和统一图矩阵以一种相互强化的方式进行,进而提高模型聚类性能。hu等从多个角度学习具有稀疏结构的一致相似矩阵,并通过实验验证所提方法高效快速,易于实现,并获得较比于几种最先进算法更好的聚类结果,且计算复杂度能几乎等同于单视图谱聚类。li等通过谱聚类中的拉普拉斯降维将原始数据空间转换到低维谱嵌入空间来构造各视图初始相似矩阵,能够有效避免原始数据空间的噪声、冗余信息等对聚类的不利影响。
3、然而,在上述研究中,一部分未考虑原始图像空间的噪声、冗余信息等对各视图初始相似矩阵鲁棒性的不利影响;一部分未考虑降维处理可能会导致丢失原始图像间的部分相似信息,进而导致各视图的初始相似矩阵构造质量低下。
技术实现思路
1、为解决以上现有技术存在的问题,本发明提出了一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,该方法包括:获取多视图图像数据,获取各个视图图像的原始图像空间;将原始图像空间进行低维谱嵌入表示,得到低维谱嵌入空间;根据低维谱嵌入空间和原始图像空间进行特征提取,得到初始相似矩阵;对所有的初始相似矩阵进行融合,并采用rsmic-ss模型对融合后的矩阵进行筛选,通过对rsmic-ss模型的目标函数进行优化求解,得到最优中心融合矩阵;根据最优中心融合矩阵对多视图图像数据进行聚类,得到聚类结果。
2、本发明的有益效果:
3、1、本发明在构造各视图初始相似矩阵时联合原始数据空间以及低维谱嵌入空间来进行,原始图像空间保留图像间的所有相似信息,避免拉普拉斯降维后相似信息丢失对聚类性能的不利影响;低维谱嵌入空间为通过拉普拉斯降维后以指示向量的形式来表征原始数据,能有效去除原始空间的噪声、冗余信息等,并保留原始图像的主体结构;通过联合这两个空间构造初始相似矩阵,能在最大程度上保证初始相似矩阵的高质量和鲁棒性;
4、2、本发明在最小化各视图初始相似矩阵与最终中心融合矩阵的差异为目标来同步更新这两种相似矩阵以及各视图的最优权重,以减小各视图间的差异对最终中心融合矩阵质量的不利影响。
1.一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,其特征在于,包括:获取多视图图像数据,获取各个视图图像的原始图像空间;将原始图像空间进行低维谱嵌入表示,得到低维谱嵌入空间;根据低维谱嵌入空间和原始图像空间进行特征提取,得到初始相似矩阵;对所有的初始相似矩阵进行融合,并采用rsmic-ss模型对融合后的矩阵进行筛选,通过对rsmic-ss模型的目标函数进行优化求解,得到最优中心融合矩阵;根据最优中心融合矩阵对多视图图像数据进行聚类,得到聚类结果。
2.根据权利要求1所述的一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,其特征在于,将原始图像空间进行低维谱嵌入表示包括将原始图像采用拉普拉斯降函数进行降维处理,得到低维谱嵌入空间。
3.根据权利要求1所述的一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,其特征在于,根据低维谱嵌入空间和原始图像空间进行特征提取包括:根据低维谱嵌入空间和原始图像空间获取各视图初始相似矩阵,并构建目标函数;对目标函数中的相似性度量参数进行求解,得到低维谱嵌入空间和原始图像空间的特征。
4.根据权利要求3所述的一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,其特征在于,目标函数的表达式为:
5.根据权利要求3所述的一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,其特征在于,对目标函数中的相似性度量参数进行求解为采用交替更新法和替代法对目标函数进行计算,得到相似性度量参数的最优解。
6.根据权利要求5所述的一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,其特征在于,采用交替更新法和替代法对目标函数进行计算包括:固定目标函数中的w(v)、a和h;根据目标函数的约束条件对目标函数进行简化,并采用拉格朗日函数以及kkt条件对简化后的函数进行求解,得到相似性度量参数的最优解。
7.根据权利要求6所述的一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,其特征在于,相似性度量参数的最优解表达式为:
8.根据权利要求1所述的一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,其特征在于,对所有的初始相似矩阵进行融合包括:通过最小化各视图初始相似矩阵与最终中心融合矩阵的差异来获取最优的中心融合矩阵;根据融合矩阵采用交替更新法以及替代法对目标函数中的参数a进行求解,具体包括:固定w、f和s,将目标函数转化为第一子问题,将第一子问题中的0范数凸松弛为1范数,并对其进行拉普拉斯变换;对经过拉普拉斯变换后的第一子问题进行求解,并采用软阈值算子对求解过程进行优化,得到最优的参数a;根据最优的参数a采用融合公式对初始相似矩阵进行融合。
9.根据权利要求8所述的一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,其特征在于,软阈值算子的表达式为:
10.根据权利要求1所述的一种基于谱嵌入和稀疏学习的秩约束自加权多视图图像聚类方法,其特征在于,rsmic-ss模型的目标函数为: