图像处理方法、装置、存储介质、电子设备及程序产品与流程

    技术2024-11-18  7


    本公开涉及图像处理,具体地,涉及一种图像处理方法、装置、存储介质、电子设备及程序产品。


    背景技术:

    1、线上业务场景中,用户需要上传资质证件照片来进行资格证明,用户上传后,经过ocr(光学字符识别)、实体抽取模型后进行实体抽取,以获取资质信息,之后经过审理平台和决策平台后完成资格审批,从而更好地保障线上业务的运行。实体抽取模型的准确率,对后续的审理和决策有非常重要的影响。


    技术实现思路

    1、提供该
    技术实现要素:
    部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。

    2、第一方面,本公开提供一种图像处理方法,所述方法包括:

    3、获取目标文本图像对应的文本识别结果;

    4、将所述文本识别结果输入至目标实体识别模型后,得到所述目标文本图像中目标文本的阅读顺序以及实体标注结果,所述实体标注结果表征文本序列中每个文本单元是否属于实体,所述文本序列为所述目标文本对应的文本序列;

    5、根据所述阅读顺序和所述实体标注结果对所述目标文本图像进行文本实体抽取。

    6、第二方面,提供一种图像处理装置,所述装置包括:

    7、获取模块,用于获取目标文本图像对应的文本识别结果;

    8、识别模块,用于将所述文本识别结果输入至目标实体识别模型后,得到所述目标文本图像中目标文本的阅读顺序以及实体标注结果,所述实体标注结果表征文本序列中每个文本单元是否属于实体,所述文本序列为所述目标文本对应的文本序列;

    9、实体抽取模块,用于根据所述阅读顺序和所述实体标注结果对所述目标文本图像进行文本实体抽取。

    10、第三方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理装置执行时实现本公开第一方面所述方法的步骤。

    11、第四方面,提供一种电子设备,包括:

    12、存储装置,其上存储有计算机程序;

    13、处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面所述方法的步骤。

    14、第五方面,提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开第一方面所述方法的步骤。

    15、通过上述技术方案,可以使用端到端的该目标实体识别模型得到目标文本图像中目标文本的阅读顺序和实体标注结果,这样,基于该阅读顺序和该实体标注结果进行文本实体的抽取,以该阅读顺序为指导进行实体预测,从而避免了文本输入顺序的异常造成的实体抽取错乱问题。

    16、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。



    技术特征:

    1.一种图像处理方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的方法,其特征在于,所述目标实体识别模型包括特征提取网络、阅读顺序识别网络和实体标注网络,所述阅读顺序识别网络和所述实体标注网络的输入端均连接在所述特征提取网络的输出端;

    3.根据权利要求2所述的方法,其特征在于,所述文本识别结果包括多个文本框分别对应的文本识别结果;

    4.根据权利要求2所述的方法,其特征在于,所述实体标注结果包括开始内部非实体bio标注结果;

    5.根据权利要求4所述的方法,其特征在于,所述根据所述阅读顺序和所述实体标注结果对所述目标文本图像进行文本实体抽取包括:

    6.根据权利要求5所述的方法,其特征在于,所述文本识别结果包括多个文本框分别对应的文本识别结果;

    7.根据权利要求1所述的方法,其特征在于,所述文本识别结果包括多个文本框中每个文本框分别对应的位置信息和文本内容;

    8.根据权利要求1-7任一项所述的方法,其特征在于,所述目标实体识别模型通过以下方式预先训练得到:

    9.根据权利要求8所述的方法,其特征在于,所述目标损失函数包括第一损失函数和第二损失函数;

    10.一种图像处理装置,其特征在于,所述装置包括:

    11.一种计算机可读介质,其上存储有计算机程序,其特征在于,该计算机程序被处理装置执行时实现权利要求1-9中任一项所述方法的步骤。

    12.一种电子设备,其特征在于,包括:

    13.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-9中任一项所述的方法的步骤。


    技术总结
    本公开涉及一种图像处理方法、装置、存储介质、电子设备及程序产品。获取目标文本图像对应的文本识别结果;将所述文本识别结果输入至目标实体识别模型后,得到所述目标文本图像中目标文本的阅读顺序以及实体标注结果,所述实体标注结果表征文本序列中每个文本单元是否属于实体,所述文本序列为所述目标文本对应的文本序列;根据所述阅读顺序和所述实体标注结果对所述目标文本图像进行文本实体抽取。

    技术研发人员:侯婉嫕,方彦明,李帆,王臣良,徐永
    受保护的技术使用者:北京字跳网络技术有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-22201.html

    最新回复(0)