文本确定方法和装置与流程

技术2025-06-08 82

本公开涉及图像识别，尤其涉及一种文本确定方法和装置。

背景技术：

1、随着科学技术的发展，文本识别已经成为人们日常生活中必不可少的一部分。例如可以对纸质的文档进行拍照之后获取该纸质文档对应的文本。在识别过程中，例如可以采用ocr识别。在ocr的基础上，植入计算机深度学习的人工智能技术，采用语义推理和语义分析，对于ocr未识别的字符，可根据该字符上下文语句信息并结合eai的语义网络的知识库，进行未识别部分的字符信息补全。在语义推理的过程中，只有当未识别字符上下文片段中的变量节点与语义知识库中语句匹配完全成功时，才将匹配结果输出，能够解决ocr技术的缺陷。但是采用单一的ocr系统进行识别会出现形似字识别准确性较低、误识别字数数量较多使得识别质量较差的情况。

技术实现思路

1、本公开提供一种文本确定方法和装置，以减少音形相似出现的误识别率高的情况，可以提高文字识别的准确性。本公开的技术方案如下：

2、本公开实施例提供一种文本确定方法，包括：

3、获取待识别图像对应的文本；

4、对所述文本进行文本特征抽取，获取所述文本对应的音形码特征；

5、采用所述文本对应的第一音形码，在所述音形码特征对应的音形码相似度知识图谱中获取文字相似度列表；

6、根据所述文本对应的第一音形码和所述文字相似度列表，确定所述文本中不满足文本要求的文字。

7、可选的，所述获取待识别图像对应的文本，包括：

8、采用光学字符识别ocr技术对所述待识别图像进行文本识别，得到所述待识别图像对应的文本。

9、可选的，所述方法还包括：

10、根据构建的目标音形码知识图谱和第一相似度阈值，重新构建音形码相似度知识图谱，其中，所述第一相似度阈值根据音形码编码个数确定。

11、可选的，所述方法还包括：

12、按照音形码编码规则，重新生成统一码、中文汉字和初始音形码知识图谱表，其中，所述初始音形码知识图谱表用于表示统一码与中文汉字的对应关系，所述中文汉字对应的结构数量大于等于十二；

13、根据拼音库，获取声母表、韵母表以及音调表；

14、根据四角编码库，获取四角编码对应表；

15、根据汉字库，获取笔画数对应表；

16、采用所述声母表、韵母表以及音调表、所述四角编码对应表和所述笔画数对应表，对所述初始音形码知识图谱表进行更新，构建目标音形码知识图谱表。

17、可选的，所述方法还包括：

18、获取分段词集合；

19、按照所述分段词集合中各分段词字数升序的顺序，获取目标分段词；

20、根据所述目标分段词对应的数据集，对所述音形码相似度知识图谱进行更新，获取更新后的音形码相似度知识图谱。

21、可选的，所述在所述音形码特征对应的音形码相似度知识图谱中获取文字相似度列表，包括：

22、获取音码规则集合中任一音码规则对应的第一子权重；

23、根据所述音码规则集合中任一音码规则，获取所述第一音形码的音码和所述音形码相似度知识图谱中任一第二音形码的音码的音码相似度差值；

24、根据所述第一子权重和所述音码相似度差值，获取所述第一音形码和所述任一第二音形码的音码相似度；

25、获取形码规则集合中任一形码规则对应的第二子权重；

26、根据所述形码规则集合中任一形码规则，获取所述第一音形码的形码和所述任一第二音形码的形码的形码相似度差值；

27、根据所述第二子权重和所述形码相似度差值，获取所述第一音形码和所述任一第二音形码的形码相似度；

28、获取所述形码相似度对应的第一权重；

29、获取所述音码相似度对应的第二权重；

30、根据所述形码相似度、所述第一权重、所述音码相似度和所述第二权重，获取所述第一音形码和所述任一第二音形码的的相似度；

31、将所述相似度大于第二相似度阈值的任一第二音形码添加至所述文字相似度列表。

32、可选的，所述根据所述文本对应的音形码和所述文字相似度列表，确定所述文本中不满足文本要求的文字，包括：

33、对所述文本进行分词处理，得到分词集合；

34、遍历所述分词集合，获取与所述分词集合中任一分词对应的分词序列；

35、根据所述任一分词和所述任一分词对应的分词序列之间的相似度，对所述文字相似度列表进行更新，得到更新后的文字相似度列表；

36、将所述更新后的文字相似度列表中相似度最高的文字，确定为所述文本中不满足文本要求的文字。

37、本公开实施例提供一种文本确定装置，其特征在于，包括：

38、文本获取单元，用于获取待识别图像对应的文本；

39、特征获取单元，用于对所述文本进行文本特征抽取，获取所述文本对应的音形码特征；

40、列表获取单元，用于采用所述文本对应的音形码，在所述音形码特征对应的目标音形码知识图谱中获取文字相似度列表；

41、文字确定单元，用于根据所述文本对应的音形码和所述文字相似度列表，确定所述文本中不满足文本要求的文字。

42、本公开实施例提供一种终端设备，包括：

43、处理器；

44、用于存储所述处理器可执行指令的存储器；

45、其中，所述处理器被配置为执行所述指令，以实现前述一方面中任一项所述的文本确定方法。

46、本公开实施例提供了一种存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述一方面中任一项所述的文本确定方法。

47、本公开实施例提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现前述一方面中任一项所述的方法。

48、本公开的实施例提供的技术方案至少带来以下有益效果：

49、在一些或者相关实施例中，获取待识别图像对应的文本；对所述文本进行文本特征抽取，获取所述文本对应的音形码特征；采用所述文本对应的第一音形码，在所述音形码特征对应的音形码相似度知识图谱中获取文字相似度列表；根据所述文本对应的第一音形码和所述文字相似度列表，确定所述文本中不满足文本要求的文字。因此，通过音形码特征，可以根据文字相似度列表确定文字，减少采用单一的ocr系统进行识别出现形似字识别准确性较低、误识别字数数量较多的情况可以提高文字识别的准确性，可以提高识别质量。

50、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

技术特征：

1.一种文本确定方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取待识别图像对应的文本，包括：

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求3所述的方法，其特征在于，所述方法还包括：

6.根据权利要求3所述的方法，其特征在于，所述在所述音形码特征对应的音形码相似度知识图谱中获取文字相似度列表，包括：

7.根据权利要求1所述的方法，其特征在于，所述根据所述文本对应的音形码和所述文字相似度列表，确定所述文本中不满足文本要求的文字，包括：

8.一种文本确定装置，其特征在于，包括：

9.一种终端设备，其特征在于，包括：

10.一种存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至7中任一项所述的文本确定方法。

技术总结
本公开涉及图像识别技术领域，尤其涉及一种文本确定方法、装置。其中，该文本确定方法，包括：获取待识别图像对应的文本；对所述文本进行文本特征抽取，获取所述文本对应的音形码特征；采用所述文本对应的音形码，在所述音形码特征对应的目标音形码知识图谱中获取文字相似度列表；根据所述文本对应的音形码和所述文字相似度列表，确定所述文本中不满足文本要求的文字。本公开通过音形码特征，可以根据文字相似度列表确定文字，减少采用单一的OCR系统进行识别出现形似字识别准确性较低、误识别字数数量较多的情况可以提高文字识别的准确性，可以提高识别质量。

技术研发人员：丁一,钱育羡,区晓江,徐亮,乔志勇
受保护的技术使用者：中国移动通信集团广东有限公司
技术研发日：
技术公布日：2024/10/24

转载请注明原文地址:https://symbian.8miu.com/read-32049.html

专利

最新回复(0)