本技术属于图像识别领域,尤其涉及一种图像识别的方法、装置、设备及存储介质。
背景技术:
1、随着计算机的出现以及人工智能的兴起,模式识别作为一门新兴学科迅速发展起来。而图像识别作为模式识别领域的一个重要部分,一直是人们研究的热点。许多多元统计方法都被成功地应用到了这一领域,这些方法都是围绕特征抽取和维数压缩的理论提出的。
2、典型相关分析(canonical correlation analysis,cca)是处理两个随机变量之间相互依存关系的一种很有价值的数据处理方法,在多元统计分析中占有非常重要的地位。然而,典型相关分析需要将原始数据向量化,也就是将二维的图像转化为一维的向量形式。可以理解的,在此过程中,可能使得原始数据的空间结构信息、语义信息等丢失,比如对图像的向量化会使得像素间的邻域关系信息丢失,不同像素之间的位置关系信息在转化为一维向量的过程中丧失,导致图像识别过程中缺少重要信息,因此准确率偏低。
技术实现思路
1、鉴于以上所述的一个或多个问题,本发明提供了一种图像识别的方法、装置、设备及存储介质,能够准确地进行图像识别。
2、将第一预设图像和第二预设图像转换为矩阵形式,得到第一预设图像矩阵和第二预设图像矩阵,所述第一预设图像和所述第二预设图像为同一类别图像;
3、分别在所述第一预设图像矩阵和所述第二预设图像矩阵的行方向和列方向上进行特征提取,得到第一特征矩阵和第二特征矩阵;
4、将所述第一特征矩阵和所述第二特征矩阵组合,得到复合矩阵;
5、基于所述复合矩阵对待识别图像进行识别,以判断所述待识别图像与所述第一预设图像和所述第二预设图像是否为同一类别。
6、在一些可能的实现方式中,将第一预设图像和第二预设图像转换为矩阵形式,得到第一预设图像矩阵和第二预设图像矩阵之前,所述方法还包括:
7、获取第一预设图像以及第二预设图像中不同像素值出现的频率;
8、根据所述频率改变所述图像中像素的像素值,使得不同像素值出现的频率相同。
9、本技术的上述实施方式通过改变所述图像中像素的像素值,使得不同像素值出现的频率相同,将不同像素值的占比平均化。同时调整预设图像集内的图像为统一的预设分辨率,方便后续的处理。
10、在一些可能的实现方式中,分别在所述第一预设图像矩阵和所述第二预设图像矩阵的行方向和列方向上进行特征提取,得到第一特征矩阵和第二特征矩阵,包括:
11、基于所述第一预设图像矩阵,在行方向和列方向上进行特征提取,得到第一特征;
12、基于所述第二预设图像矩阵,在行方向和列方向上进行特征提取,得到第二特征;
13、根据所述第一特征确定所述第一预设图像矩阵在特征空间的第一特征矩阵,以及根据所述第二特征确定所述第二预设图像矩阵在特征空间的第二特征矩阵。
14、本技术的上述实施方式通过对第一预设图像矩阵和第二预设图像矩阵分别在行方向和列方向上进行特征提取,进而得到第一特征和第二特征。之后计算了第一预设图像在所述第一行特征和所述第一列特征定义下的特征空间的投影,得到了第一预设图像的特征信息。同样的,通过计算所述第二行特征和所述第二列特征与所述第二预设图像矩阵的乘积,得到了第二预设图像的特征信息。将此第一预设图像的特征信息和第二预设图像的特征信息作为第一特征矩阵和第二特征矩阵,可以提高后续识别过程中的精确度。
15、在一些可能的实现方式中,根据所述第一特征确定所述第一预设图像矩阵在特征空间的第一特征矩阵,以及根据所述第二特征确定所述第二预设图像矩阵在特征空间的第二特征矩阵,包括:
16、计算所述第一特征与所述第一预设图像矩阵的乘积,得到第一特征矩阵;
17、计算所述第二特征与所述第二预设图像矩阵的乘积,得到第二特征矩阵。
18、本技术的上述实施方式通过计算所述第一特征与所述第一预设图像矩阵的乘积,以及计算所述第二特征与所述第二预设图像矩阵的乘积,来得到第一特征矩阵和到第二特征矩阵。这样可以得到准确的第一特征矩阵和第二特征矩阵。
19、在一些可能的实现方式中,基于所述第一预设图像矩阵,在行方向和列方向上进行特征提取,得到第一特征,包括:
20、根据所述列特征与第一预设图像矩阵的计算结果,更新所述预设行特征;
21、根据所述预设行特征和所述列特征,确定第一特征;
22、所述基于所述第二预设图像矩阵,在行方向和列方向上进行特征提取,得到第二特征,包括:
23、根据所述列特征与第二预设图像矩阵的计算结果,更新所述预设行特征;
24、根据所述预设行特征和所述列特征,确定第二特征。
25、本技术的上述实施方式通过列特征与第一预设图像矩阵或第二预设图像矩阵进行计算之后更新预设行特征,进而得到第一特征或第二特征。这样可以进行迭代计算,以在不断迭代中得到更准确的特征数据。
26、在一些可能的实现方式中,通过预设行特征,对所述第一预设图像矩阵和所述第二预设图像矩阵特征提取,得到列特征,包括:
27、将预设行特征与所述第一预设图像矩阵进行计算,得到第一最大非零特征值;
28、将预设行特征与所述第二预设图像矩阵进行计算,得到第二最大非零特征值;
29、根据所述第一最大非零特征值对应的特征向量,以及第二最大非零特征值对应的特征向量,得到列特征。
30、本技术的上述实施方式通过计算得到最大非零特征值,并将此最大非零特征值对应的特征向量作为预设第一列特征和预设第二列特征。以此获得有效的特征数据。
31、在一些可能的实现方式中,将所述第一特征矩阵和所述第二特征矩阵组合,得到复合矩阵,包括:
32、将所述第一特征矩阵和所述第二特征矩阵中的任一个作为虚部,另一矩阵作为实部;
33、将所述虚部与所述实部相加,得到特征复矩阵;
34、将所述特征复矩阵作为复合矩阵。
35、本技术的上述实施方式通过将第一特征矩阵和所述第二特征矩阵结合得到特征复矩阵,然后基于特征复矩阵对待识别图像进行识别。可以结合使用多个特征,得到更准确的识别结果。
36、在一些可能的实现方式中,基于所述复合矩阵对待识别图像进行识别,包括:
37、计算所述复合矩阵与待识别图像矩阵的相似度;
38、在所述相似度超过预设值的情况下,确定所述待识别图像与所述第一预设图像和所述第二预设图像为同一类别。
39、本技术的上述实施方式通过计算所述特征复矩阵与待识别图像矩阵的相似度,进而进行待识别图像类别的判断,可以准确地得到识别结果。
40、第二方面,本技术实施例提供一种图像识别的装置,所述装置包括:
41、转换模块,用于将第一预设图像和第二预设图像转换为矩阵形式,得到第一预设图像矩阵和第二预设图像矩阵,所述第一预设图像和所述第二预设图像为同一类别图像;
42、提取模块,用于分别在所述第一预设图像矩阵和所述第二预设图像矩阵的行方向和列方向上进行特征提取,得到第一特征矩阵和第二特征矩阵;
43、组合模块,用于将所述第一特征矩阵和所述第二特征矩阵组合,得到复合矩阵;
44、识别模块,用于基于所述复合矩阵对待识别图像进行识别,以判断所述待识别图像与所述第一预设图像和所述第二预设图像是否为同一类别。
45、第三方面,本技术实施例提供一种图像识别的设备,设备包括:处理器,以及存储有计算机程序指令的存储器;所述处理器读取并执行所述计算机程序指令,以实现如上文描述的图像识别的方法。
46、第四方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如上文描述的图像识别的方法。
47、第五方面,本技术实施例提供一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如上文描述的图像识别的方法。
48、本技术上述方式通过将图像转换为矩阵形式,然后从此图像矩阵的行和列两个方向上进行特征提取,可以更好的刻画此图像矩阵行向量之间与列向量之间的关系,能够保留原图像中像素之间的关系,因此提取的特征可以更加准确的反映图像的信息,利用此特征进行图像识别的准确率也更高。
1.一种图像识别的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的图像识别的方法,其特征在于,所述将第一预设图像和第二预设图像转换为矩阵形式,得到第一预设图像矩阵和第二预设图像矩阵之前,所述方法还包括:
3.根据权利要求1所述的图像识别的方法,其特征在于,所述分别在所述第一预设图像矩阵和所述第二预设图像矩阵的行方向和列方向上进行特征提取,得到第一特征矩阵和第二特征矩阵,包括:
4.根据权利要求3所述的图像识别的方法,其特征在于,所述根据所述第一特征确定所述第一预设图像矩阵在特征空间的第一特征矩阵,以及根据所述第二特征确定所述第二预设图像矩阵在特征空间的第二特征矩阵,包括:
5.根据权利要求3所述的图像识别的方法,其特征在于,所述基于所述第一预设图像矩阵,在行方向和列方向上进行特征提取,得到第一特征,包括:
6.根据权利要求5所述的图像识别的方法,其特征在于,所述通过预设行特征,对所述第一预设图像矩阵和所述第二预设图像矩阵特征提取,得到列特征,包括:
7.根据权利要求1至6任一项所述的图像识别的方法,其特征在于,所述将所述第一特征矩阵和所述第二特征矩阵组合,得到复合矩阵,包括:
8.根据权利要求1至6任一项所述的图像识别的方法,其特征在于,所述基于所述复合矩阵对待识别图像进行识别,包括:
9.一种图像识别的装置,其特征在于,所述装置包括:
10.一种图像识别的设备,其特征在于,所述设备包括:处理器,以及存储有计算机程序指令的存储器;所述处理器读取并执行所述计算机程序指令,以实现如权利要求1-8任意一项所述的图像识别的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-8任意一项所述的图像识别的方法。
12.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-8任意一项所述的图像识别的方法。