客观题位置的智能识别方法、装置、电子设备及存储介质与流程

技术2025-03-30 58

本发明涉及人工智能领域，具体而言，涉及客观题位置的智能识别方法、装置、电子设备及存储介质。

背景技术：

1、为了降低阅卷强度和出错率，在考试时通常采用答题卡来进行阅卷。在对答题卡中的客观题图像进行识别时，传统客观题识别方法通常是采用预先训练的深度学习模型识别客观题位置。客观题位置具体为客观题中各题号的位置以及各题号对应的每个选项的位置。

2、但是，由于深度学习模型是基于训练数据进行训练得到的，因此传统客观题识别方法只能识别与训练数据中的客观题位置的一致的客观题图像，一旦答题卡中的客观题结构发生改变，将无法识别的客观题位置。

技术实现思路

1、有鉴于此，本技术的目的在于提供客观题位置的智能识别方法、装置、电子设备及存储介质，能够完整获取所有选项和题号的位置，减少其他检测方法造成的检测缺失，避免因客观题结构改变和试卷打印质量低造成的模糊缺失导致无法识别客观题版面结构信息，正确率达92%以上，有效降低人力成本。

2、第一方面，本技术实施例提供了一种客观题版面信息的智能识别方法，该方法包括：

3、获取待识别客观题区域图像中客观题的识别框；

4、根据所有识别框的高度值和宽度值，确定待识别客观题区域的选项高度和选项宽度；

5、根据识别框中每行识别框间的中心点横向距离与选项宽度之间的数值关系、每列识别框间的中心点纵向距离与选项高度之间的数值关系，确定所有行、列之间的分割坐标；

6、根据分割坐标对客观题区域图像进行切割得到多个切片图像，并根据归一化相关系数对切片图像中对应像素点进行叠加，根据叠加后的图像重新确定选项高度和选项宽度；

7、根据切片图像的识别情况以及重新确定的选项高度、选项宽度，得到待识别客观题区域中每个题号的位置以及每个题号的选项位置。

8、在一种可能的实施方式中，通过下述步骤获取识别框：

9、通过边缘检测算法对待识别客观题区域进行检测得到第一边缘识别框，对横向距离小于预置数值的第一边缘识别框进行合并得到合并识别框；并通过文本识别模型对待识别客观题区域进行检测得到文本识别框；

10、根据合并识别框通过边缘检测算法再次对待识别客观题区域进行检测得到第二边缘识别框；

11、对第二边缘识别框和文本识别框进行合并得到识别框。

12、在一种可能的实施方式中，对横向距离小于预置数值的第一边缘识别框进行合并得到合并识别框，包括：

13、将高度值与宽度值的比值大于预设高宽比的第一边缘识别框确定为目标边缘识别框；

14、若存在黑色的第一边缘识别框，则将黑色的第一边缘识别框与其他第一边缘识别框的最小横向距离，确定为目标扩展距离；否则，将预置扩展距离确定为目标扩展距离；

15、计算目标边缘识别框与其相邻的第一边缘识别框之间的距离，并确定该距离对应的众数；

16、对目标边缘识别框的左右两侧进行横向扩大预目标扩展距离，目标边缘识别框与相邻第一边缘识别框的横向距离小于众数；

17、对具有重合区域的边缘识别框进行合并得到合并识别框。

18、在一种可能的实施方式中，根据合并识别框通过边缘检测算法再次对待识别客观题区域进行检测得到第二边缘识别框，包括：

19、对待识别客观题区域进行二值化处理以增加合并识别框内像素点的亮度，得到待识别客观题区域图像；

20、通过边缘检测算法再次对待识别客观题区域图像进行检测，得到中间边缘识别框；

21、对宽度与高度的比值大于预设宽高比的中间边缘识别框进行分割，得到第二边缘识别框。

22、在一种可能的实施方式中，对宽度与高度的比值大于预设宽高比的中间边缘识别框进行分割，得到第二边缘识别框，包括：

23、对宽度与高度的比值大于预设宽高比的中间边缘识别框对应的局部图像进行竖直投影，得到竖直投影图像；

24、将竖直投影图像中像素值最低点的位置确定为待分割位置；

25、基于待识别客观题区域图像中的待分割位置对宽度与高度的比值大于预设宽高比的中间边缘识别框进行分割，得到第二边缘识别框。

26、在一种可能的实施方式中，根据识别框中每行识别框间的中心点横向距离与选项宽度之间的数值关系、每列识别框间的中心点纵向距离与选项高度之间的数值关系，确定所有行、列之间的分割坐标，包括：

27、根据识别框中每行识别框间的中心点横向距离与选项宽度之间的数值关系，确定所有行之间的分割坐标；

28、根据识别框中每列识别框间的中心点纵向距离与选项高度之间的数值关系，确定所有列之间的分割坐标。

29、在一种可能的实施方式中，根据识别框中每行识别框间的中心点横向距离与选项宽度之间的数值关系，确定所有行之间的分割坐标，包括：

30、针对每一行的每个识别框，计算该识别框与该行中其他识别框之间的中心点横向距离；

31、根据该识别框对应的中心点横向距离与选项宽度之间的差值，判断该识别框是否为第一目标识别框；

32、将该行的所有第一目标识别框内所有像素点的纵坐标中最小纵坐标确定为分割坐标。

33、在一种可能的实施方式中，根据识别框中每列识别框间的中心点纵向距离与选项高度之间的数值关系，确定所有列之间的分割坐标，包括：

34、针对每一列的每个识别框，计算该识别框与该列中其他识别框之间的中心点纵向距离；

35、根据该识别框对应的中心点纵向距离与选项高度之间的差值，判断该识别框是否为第二目标识别框；

36、将该列的所有第二目标识别框内所有像素点的横坐标中最大横坐标确定为分割坐标。

37、在一种可能的实施方式中，根据归一化相关系数对切片图像中对应像素点进行叠加，包括：

38、通过模板图像中每个像素点分别与第i个其他切片图像中各个像素点的归一化相关性系数，确定其他切片图像中分别与模板图像中各像素点分别对应的像素点；模板图像的初始值为第1个切片图像；i的初始值为2；

39、将第i个其他切片图像和模板图像中对应的像素点进行像素值叠加得到最新的模板图像；i=i+1，并跳转到步骤通过模板图像中每个像素点分别与第i个其他切片图像中各个像素点的归一化相关性系数继续执行，直到最后一个切片图像；并将最终得到的模板图像确定为叠加后的图像。

40、第二方面，本技术实施例还提供了一种客观题位置的智能识别装置，该装置包括：

41、获取模块，用于获取待识别客观题区域图像中客观题的识别框；

42、确定模块，用于根据所有识别框的高度值和宽度值，确定待识别客观题区域的选项高度和选项宽度；

43、确定模块，还用于根据识别框中每行识别框间的中心点横向距离与选项宽度之间的数值关系、每列识别框间的中心点纵向距离与选项高度之间的数值关系，确定所有行、列之间的分割坐标；

44、叠加确定模块，用于根据分割坐标对客观题区域图像进行切割得到多个切片图像，并根据归一化相关系数对切片图像中对应像素点进行叠加，根据叠加后的图像重新确定所述选项高度和所述选项宽度；

45、确定模块，还用于根据切片图像的识别情况以及重新确定的选项高度、选项宽度，得到待识别客观题区域中每个题号的位置以及每个题号的选项位置。

46、在一种可能的实施方式中，获取模块，具体用于通过边缘检测算法对待识别客观题区域进行检测得到第一边缘识别框，对横向距离小于预置数值的第一边缘识别框进行合并得到合并识别框；并通过文本识别模型对待识别客观题区域进行检测得到文本识别框；根据合并识别框通过边缘检测算法再次对待识别客观题区域进行检测得到第二边缘识别框；对第二边缘识别框和文本识别框进行合并得到识别框。

47、在一种可能的实施方式中，获取模块，还用于：

48、将高度值与宽度值的比值大于预设高宽比的第一边缘识别框确定为目标边缘识别框；

49、若存在黑色的第一边缘识别框，则将黑色的第一边缘识别框与其他第一边缘识别框的最小横向距离，确定为目标扩展距离；否则，将预置扩展距离确定为目标扩展距离；

50、计算目标边缘识别框与其相邻的第一边缘识别框之间的距离，并确定该距离对应的众数；

51、对目标边缘识别框的左右两侧进行横向扩大预目标扩展距离，目标边缘识别框与相邻第一边缘识别框的横向距离小于众数；

52、对具有重合区域的边缘识别框进行合并得到合并识别框。

53、在一种可能的实施方式中，获取模块，还用于：

54、对待识别客观题区域进行二值化处理以增加合并识别框内像素点的亮度，得到待识别客观题区域图像；

55、通过边缘检测算法再次对待识别客观题区域图像进行检测，得到中间边缘识别框；

56、对宽度与高度的比值大于预设宽高比的中间边缘识别框进行分割，得到第二边缘识别框。

57、在一种可能的实施方式中，获取模块，还用于：

58、对宽度与高度的比值大于预设宽高比的中间边缘识别框对应的局部图像进行竖直投影，得到竖直投影图像；

59、将竖直投影图像中像素值最低点的位置确定为待分割位置；

60、基于待识别客观题区域图像中的待分割位置对宽度与高度的比值大于预设宽高比的中间边缘识别框进行分割，得到第二边缘识别框。

61、在一种可能的实施方式中，确定模块，具体用于根据识别框中每行识别框间的中心点横向距离与选项宽度之间的数值关系，确定所有行之间的分割坐标；根据识别框中每列识别框间的中心点纵向距离与选项高度之间的数值关系，确定所有列之间的分割坐标。

62、在一种可能的实施方式中，确定模块，具体用于针对每一行的每个识别框，计算该识别框与该行中其他识别框之间的中心点横向距离；根据该识别框对应的中心点横向距离与选项宽度之间的差值，判断该识别框是否为第一目标识别框；将该行的所有第一目标识别框内所有像素点的纵坐标中最小纵坐标确定为分割坐标。

63、在一种可能的实施方式中，确定模块，具体用于针对每一列的每个识别框，计算该识别框与该列中其他识别框之间的中心点纵向距离；根据该识别框对应的中心点纵向距离与选项高度之间的差值，判断该识别框是否为第二目标识别框；将该列的所有第二目标识别框内所有像素点的横坐标中最大横坐标确定为分割坐标。

64、在一种可能的实施方式中，叠加确定模块，具体用于通过模板图像中每个像素点分别与第i个其他切片图像中各个像素点的归一化相关性系数，确定其他切片图像中分别与模板图像中各像素点分别对应的像素点；模板图像的初始值为第1个切片图像；i的初始值为2；将第i个其他切片图像和模板图像中对应的像素点进行像素值叠加得到最新的模板图像；i=i+1，并跳转到步骤通过模板图像中每个像素点分别与第i个其他切片图像中各个像素点的归一化相关性系数继续执行，直到最后一个切片图像；并将最终得到的模板图像确定为叠加后的图像。

65、第三方面，本技术实施例还提供了一种电子设备，包括：处理器、存储介质和总线，存储介质存储有处理器可执行的机器可读指令，当电子设备运行时，处理器与存储介质之间通过总线通信，处理器执行机器可读指令，以执行如第一方面任一项客观题位置的智能识别方法的步骤。

66、第四方面，本技术实施例还提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器运行时执行如第一方面任一项客观题位置的智能识别方法的步骤。

67、本技术实施例提供了客观题位置的智能识别方法、装置、电子设备及存储介质，包括：获取待识别客观题区域图像中客观题的识别框；根据所有识别框的高度值和宽度值，确定待识别客观题区域的选项高度和选项宽度；根据识别框中每行识别框间的中心点横向距离与选项宽度之间的数值关系、每列识别框间的中心点纵向距离与选项高度之间的数值关系，确定所有行、列之间的分割坐标；根据分割坐标对客观题区域图像进行切割得到多个切片图像，并根据归一化相关系数对切片图像中对应像素点进行叠加，根据叠加后的图像重新确定选项高度和选项宽度；根据切片图像的识别情况以及重新确定的选项高度、选项宽度，得到待识别客观题区域中每个题号的位置以及每个题号的选项位置。本技术能完整获取所有选项和题号的信息，减少其他检测方法造成的检测缺失，避免因客观题结构改变和试卷打印质量低造成的模糊缺失导致无法识别客观题版面结构信息，正确率达92%以上，有效降低人力成本。

技术特征：

1.一种客观题位置的智能识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的客观题位置的智能识别方法，其特征在于，通过下述步骤获取所述识别框：

3.根据权利要求2所述的客观题位置的智能识别方法，其特征在于，所述对横向距离小于预置数值的第一边缘识别框进行合并得到合并识别框，包括：

4.根据权利要求2所述的客观题位置的智能识别方法，其特征在于，所述根据所述合并识别框通过边缘检测算法再次对所述待识别客观题区域进行检测得到第二边缘识别框，包括：

5.根据权利要求4所述的客观题位置的智能识别方法，其特征在于，所述对宽度与高度的比值大于预设宽高比的中间边缘识别框进行分割，得到第二边缘识别框，包括：

6.根据权利要求1-5任一项所述的客观题位置的智能识别方法，其特征在于，所述根据所述识别框中每行识别框间的中心点横向距离与所述选项宽度之间的数值关系、每列识别框间的中心点纵向距离与所述选项高度之间的数值关系，确定所有行、列之间的分割坐标，包括：

7.根据权利要求6所述的客观题位置的智能识别方法，其特征在于，所述根据所述识别框中每行识别框间的中心点横向距离与所述选项宽度之间的数值关系，确定所有行之间的分割坐标，包括：

8.根据权利要求6所述的客观题位置的智能识别方法，其特征在于，所述根据所述识别框中每列识别框间的中心点纵向距离与所述选项高度之间的数值关系，确定所有列之间的分割坐标，包括：

9.根据权利要求1所述的客观题位置的智能识别方法，其特征在于，所述根据归一化相关系数对所述切片图像中对应像素点进行叠加，包括：

10.一种客观题位置的智能识别装置，其特征在于，所述装置包括：

11.一种电子设备，其特征在于，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如权利要求1至9任一项所述的客观题位置的智能识别方法的步骤。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至9任一项所述的客观题位置的智能识别方法的步骤。

技术总结
本发明涉及人工智能领域，尤其涉及客观题位置的智能识别方法、装置、电子设备及存储介质，包括：根据传统图像分割算法获取尽可能多的正确的选项位置，预估客观题区域的选项高度和选项宽度；根据选项位置和选项高度和选项宽度得到所有行、列之间的分割坐标，对客观题区域进行切割得到切片图像；基于对切片图像对应像素点进行叠加后的图像确定选项高度和选项宽度；根据切片图像识别情况、重新确定的选项高度、选项宽度得到题号和选项的位置。本申请能完整获取所有选项和题号的信息，减少其他检测方法造成的检测缺失，避免因客观题结构改变和试卷打印质量低造成的模糊缺失导致无法识别客观题版面结构信息，正确率达92%以上，有效降低人力成本。

技术研发人员：王晨太,于丁,田艳莉,卢衡,杨林
受保护的技术使用者：北京和气聚力教育科技有限公司
技术研发日：
技术公布日：2024/10/24

转载请注明原文地址:https://symbian.8miu.com/read-28381.html

专利

最新回复(0)