图像识别方法、装置、设备、存储介质及程序产品与流程

    技术2025-03-14  43


    本技术属于图像识别的,尤其涉及一种图像识别方法、装置、设备、存储介质及程序产品。


    背景技术:

    1、随着人工智能技术的发展,出现了图像识别技术,图像识别是指利用计算机对图像进行处理、分析和理解。以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。

    2、在相关技术中,在图像识别任务中,利用卷积神经网络模型对图片的背景和核心部分的局部特征进行提取,然后将局部特征输入至全局平均池化层得到全局特征,然后利用注意力机制模块对局部特征进行融合,得到局部融合特征,再将局部融合特征与全局特征融合得到最终特征,再对最终特征进行识别,得到识别结果。

    3、在上述图片识别过程中,仅单一考虑了背景信息对最终特征的影响,识别精度低。


    技术实现思路

    1、本技术实施例提供一种图像识别方法、装置、设备、存储介质及程序产品,能够提高图片识别的精度,从而提高图片识别的准确性。

    2、一方面,本技术实施例提供一种图像识别方法,方法包括:

    3、获取待识别图像;

    4、将所述待识别图像输入至图像识别模型内,利用所述图像识别模型对所述待识别图像分别进行局部特征提取和全局特征提取,得到局部特征信息和全局特征信息,其中,所述局部特征信息根据所述待识别图像的第一注意力分值和第二注意力分值计算得到;

    5、利用所述图像识别模型将所述局部特征信息和全局特征信息进行融合,得到图片特征信息;

    6、利用所述图像识别模型根据所述图片特征信息确定识别结果。

    7、可选的,利用所述图像识别模型对所述待识别图像进行局部特征提取,得到局部特征信息包括:

    8、对所述待识别图像进行基础特征信息提取,得到基础特征信息;

    9、对所述待识别图像进行卷积分值计算,得到第一注意力分值;

    10、对所述待识别图像进行相关性分值计算,得到第二注意力分值;

    11、根据所述第一注意力分值和所述第二注意力分值按照预设计算规则对所述基础特征信息进行计算,得到局部特征信息。

    12、可选的,所述对所述待识别图像进行相关性分值计算,得到第二注意力分值计算包括:

    13、获取所述待识别图像的相关性信息,所述相关性信息包括时间周期、特征维度和用户信息中的至少一种;

    14、对所述相关性信息进行特征编码,得到相关性编码集;

    15、将所述相关性编码进行向量转换,得到相关性向量集;

    16、将所述相关性向量集和预设参数向量按照预设规则进行向量计算,得到注意力向量集合;

    17、根据所述相关性信息对所述注意力向量集合分别进行全部注意力计算、时间注意力计算和列注意力计算,得到与所述相关性信息对应的第三注意力分值;

    18、将所述第三注意力分值进行相加,得到所述第二注意力分值。

    19、可选的,所述将所述局部特征信息和全局特征信息进行融合,得到图片特征信息包括:

    20、将所述局部特征信息和所述全局特征信息进行向量转化,得到局部特征向量和全局特征向量;

    21、计算所述局部特征向量在所述全局特征向量的向量投影,得到投影向量;

    22、根据所述投影向量、局部特征信息和全局特征信息计算正交特征向量;

    23、将所述局部特征向量与所述正交特征向量作差,得到非正交特征向量;

    24、将所述非正交特征向量和所述全局特征向量进行拼接,得到融合特征向量;

    25、对所述融合特征向量做采样处理,得到图片特征信息。

    26、可选的,在所述将待识别图像输入值图像识别模型之前,所述方法还包括:

    27、获取训练样本集,所述训练样本集包括多个第一训练样本和多个第二训练样本,每个所述第一训练样本包括真实背景信息的目标原图数据和目标图像代表信息,每个所述第二训练样本包括虚假背景信息的目标原图数据和目标图像代表信息;

    28、利用所述训练样本集对预设模型进行训练,直至满足训练停止条件,得到图像识别模型。

    29、可选的,获取训练样本集包括:

    30、收集预设图片库中的原图数据和目标图像代表信息,将所述预设图片库中的原图数据和目标图像代表信息作为第一训练样本;和/或,

    31、获取目标图像和多个背景图像;

    32、对每个所述背景图像进行基础参数调整,得到背景调整图像;

    33、将所述目标图像拼接至所述背景调整图像上,得到第一目标拼接图像;

    34、将所述第一目标拼接图像确定为第二训练样本。

    35、可选的,获取第二训练样本包括:

    36、获取待生成目标图像;

    37、将所述生成目标图像与预设背景图像进行拼接,得到第二目标拼接图像;

    38、将所述第二目标拼接图像确定为第二训练样本。

    39、可选的,在所述获取训练样本集之后,所述方法还包括:

    40、获取所述第一训练样本和所述第二训练样本的数量比例;

    41、在所述数量比例不大于预设数量比例的情况下,根据预设数量比例对第二训练样本的数量进行调整,直至所述数量比例达到预设数量比例。

    42、可选的,在所述获取训练样本集之后,所述方法还包括:

    43、计算所述训练样本集中的每个训练样本的颜色像素值;

    44、根据所述颜色像素值对所述训练样本集进行筛选,得到相似图像;

    45、根据所述相似图像增加第一训练样本数量和第二训练样本数量,得到新的训练样本集。

    46、可选的,所述利用所述训练样本集对预设模型进行训练,直至满足训练停止条件,得到训练后的图像识别模型包括:

    47、对每个训练样本,分别执行以下步骤:

    48、将所述目标原图数据输入至预设模型内,得到识别目标图像代表信息;

    49、根据所述识别目标图像代表信息和目标图像代表信息确定所述预设模型的损失函数值;

    50、在所述损失函数值不满足训练停止条件的情况下,调整所述预设模型的模型参数,并利用所述训练样本集训练参数调整后的预设模型,直至满足所述训练停止条件,得到图像识别模型。

    51、可选的,在将所述目标原图数据输入至预设模型内,得到识别目标图像代表信息之前,所述方法还包括:

    52、对每个所述训练样本按照预设数据增强方式进行数据增强,得到增强训练样本集。

    53、另一方面,本技术实施例提供了一种图像识别装置,装置包括:

    54、获取模块,用于获取待识别图像;

    55、输入提取模块,用于将所述待识别图像输入至图像识别模型内,利用所述图像识别模型对所述待识别图像分别进行局部特征提取和全局特征提取,得到局部特征信息和全局特征信息,其中,所述局部特征信息根据所述待识别图像的第一注意力分值和第二注意力分值计算得到;

    56、融合模块,用于将所述局部特征信息和全局特征信息进行融合,得到图片特征信息;

    57、确定模块,用于根据所述图片特征信息确定识别结果。

    58、再一方面,本技术实施例提供了一种电子设备,设备包括:

    59、处理器以及存储有计算机程序指令的存储器;

    60、所述处理器执行所述计算机程序指令时实现如第一方面所述的图像识别方法。

    61、再一方面,本技术实施例提供了一种计算机存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如第一方面所述的图像识别方法。

    62、再一方面,本技术实施例提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如第一方面任意一项所述的图像识别方法。

    63、本技术实施例提供的图像识别方法,在对待识别图像进行识别的过程中,首先将待识别图像输入至图像识别模型中,图像识别模型对待识别图像进行注意力计算,通过不同维度的注意力计算提取到注意力分值高的局部特征信息,在计算待识别图像的第一注意力分值和第二注意力分值时,降低背景图像对局部特征信息的影响,从多个角度提取局部特征信息,使得到的局部特征信息更加精准,然后再通过局部特征信息和全局特征信息进行融合,将精准提取得到的局部特征信息与全局特征信息融合,得到图片特征信息,然后通过图片特征信息进行识别。由此,本技术实施例通过图像识别模型更注意于多维度的局部特征信息,降低了背景信息对图片特征信息的影响,充分考虑了多维度注意力分值对提取局部特征信息的影响,使得到的图片特征信息更加注意于待识别图像的目标特征,以此能够更加精准的进行图像识别,从而提高图像识别的准确性。


    技术特征:

    1.一种图像识别方法,其特征在于,包括:

    2.根据权利要求1所述的方法,其特征在于,利用所述图像识别模型对所述待识别图像进行局部特征提取,得到局部特征信息包括:

    3.根据权利要求2所述的方法,其特征在于,所述对所述待识别图像进行相关性分值计算,得到第二注意力分值计算包括:

    4.根据权利要求1所述的方法,其特征在于,所述将所述局部特征信息和全局特征信息进行融合,得到图片特征信息包括:

    5.根据权利要求1所述的方法,其特征在于,在所述将待识别图像输入值图像识别模型之前,所述方法还包括:

    6.根据权利要求5所述的方法,其特征在于,获取训练样本集包括:

    7.根据权利要求5或6所述的方法,其特征在于,获取第二训练样本包括:

    8.根据权利要求5所述的方法,其特征在于,在所述获取训练样本集之后,所述方法还包括:

    9.根据权利要求5所述的方法,其特征在于,在所述获取训练样本集之后,所述方法还包括:

    10.根据权利要求5所述的方法,其特征在于,所述利用所述训练样本集对预设模型进行训练,直至满足训练停止条件,得到训练后的图像识别模型包括:

    11.根据权利要求10所述的方法,其特征在于,在将所述目标原图数据输入至预设模型内,得到识别目标图像代表信息之前,所述方法还包括:

    12.一种图像识别装置,其特征在于,所述装置包括:

    13.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;

    14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-11任意一项所述的图像识别方法。

    15.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-11任意一项所述的图像识别方法。


    技术总结
    本申请公开了一种图像识别方法、装置、设备、存储介质及程序产品。获取待识别图像;将所述待识别图像输入至图像识别模型内,利用所述图像识别模型对所述待识别图像分别进行局部特征提取和全局特征提取,得到局部特征信息和全局特征信息,其中,所述局部特征信息根据所述待识别图像的第一注意力分值和第二注意力分值计算得到;利用所述图像识别模型将所述局部特征信息和全局特征信息进行融合,得到图片特征信息;利用所述图像识别模型根据所述图片特征信息确定识别结果。根据本申请实施例,能够提高图片识别的精度,从而提高图片识别的准确性。

    技术研发人员:熊华梁,蒋甫,许人文,王轶奇,陈宇恒
    受保护的技术使用者:中移物联网有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-27482.html

    最新回复(0)