本发明涉及合同信息处理领域,具体而言,涉及一种油田合同分析关键信息提取方法及装置。
背景技术:
1、随着智能化科技的不断发展,人们的生活、工作、学习之中越来越多地用到了智能化设备,使用智能化科技手段,提高了人们生活的质量,增加了人们学习和工作的效率。
2、目前,针对油田合同中的关键信息的提取,通常采用根据实际使用合同的场景来制定预设的关键信息字眼,并将所有的关键信息字眼进行统一的归纳和处理,得到关键信息字眼的的数据集合,并根据上述得到的数据集合来进行关键信息摘取,摘取方法一般包括全篇检索、人工识别等,但是现有技术中对于合同关键信息的分析和提取过程仅仅是利用了固定的规则或者使用者预设的几种规则来进行摘取,并将摘取到的信息作为关键信息的内容进行展示和输出,当面对复杂的合同或者多个不同类型的合同时,工作量会变得很大,同时降低了关键信息提取的质量和效率。
3、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本发明实施例提供了一种油田合同分析关键信息提取方法及装置,以至少解决现有技术中对于合同关键信息的分析和提取过程仅仅是利用了固定的规则或者使用者预设的几种规则来进行摘取,并将摘取到的信息作为关键信息的内容进行展示和输出,当面对复杂的合同或者多个不同类型的合同时,工作量会变得很大,同时降低了关键信息提取的质量和效率的技术问题。
2、根据本发明实施例的一个方面,提供了一种油田合同分析关键信息提取方法,包括:采集油田合同中的全局文字数据;根据预设规则将所述全局文字数据分解为关键标记数据和非关键标记数据;将所述关键标记数据进行转换,得到关键信息区域,其中,所述关键信息区域包含了所有与所述关键标记数据有关联的信息片段;根据所述关键信息区域和所述全局文字数据,生成合同关键信息。
3、可选的,所述全局文字数据包括:合同正文文字数据、合同参数文字数据,其中,所述合同参数文字数据包括:合同页码数据、合同字体数据、合同间距数据。
4、可选的,所述将所述关键标记数据进行转换,得到关键信息区域包括:将所述关键标记数据和所述全局文字数据进行标记定位,得到切点数据;根据所述切点数据和所述全局文字数据进行局部数据提取,得到关键信息区域。
5、可选的,所述根据所述切点数据和所述全局文字数据进行局部数据提取,得到关键信息区域包括:获取采集范围阈值,其中,所述采集范围阈值根据应用场景中预设的场景需求生成;根据所述切点数据和所述范围阈值,对所述全局文字数据进行定位操作,并在定位位置的所述范围阈值内提取文字数据,形成所述关键信息区域。
6、根据本发明实施例的另一方面,还提供了一种油田合同分析关键信息提取装置,包括:采集模块,用于采集油田合同中的全局文字数据;分解模块,用于根据预设规则将所述全局文字数据分解为关键标记数据和非关键标记数据;转换模块,用于将所述关键标记数据进行转换,得到关键信息区域,其中,所述关键信息区域包含了所有与所述关键标记数据有关联的信息片段;生成模块,用于根据所述关键信息区域和所述全局文字数据,生成合同关键信息。
7、可选的,所述全局文字数据包括:合同正文文字数据、合同参数文字数据,其中,所述合同参数文字数据包括:合同页码数据、合同字体数据、合同间距数据。
8、可选的,所述转换模块包括:定位单元,用于将所述关键标记数据和所述全局文字数据进行标记定位,得到切点数据;提取单元,用于根据所述切点数据和所述全局文字数据进行局部数据提取,得到关键信息区域。
9、可选的,所述提取单元包括:获取子单元,用于获取采集范围阈值,其中,所述采集范围阈值根据应用场景中预设的场景需求生成;提取子单元,用于根据所述切点数据和所述范围阈值,对所述全局文字数据进行定位操作,并在定位位置的所述范围阈值内提取文字数据,形成所述关键信息区域。
10、根据本发明实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行一种油田合同分析关键信息提取方法。
11、根据本发明实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行一种油田合同分析关键信息提取方法。
12、在本发明实施例中,采用采集油田合同中的全局文字数据;根据预设规则将所述全局文字数据分解为关键标记数据和非关键标记数据;将所述关键标记数据进行转换,得到关键信息区域,其中,所述关键信息区域包含了所有与所述关键标记数据有关联的信息片段;根据所述关键信息区域和所述全局文字数据,生成合同关键信息的方式,解决了现有技术中对于合同关键信息的分析和提取过程仅仅是利用了固定的规则或者使用者预设的几种规则来进行摘取,并将摘取到的信息作为关键信息的内容进行展示和输出,当面对复杂的合同或者多个不同类型的合同时,工作量会变得很大,同时降低了关键信息提取的质量和效率的技术问题。
1.一种油田合同分析关键信息提取方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述全局文字数据包括:合同正文文字数据、合同参数文字数据,其中,所述合同参数文字数据包括:合同页码数据、合同字体数据、合同间距数据。
3.根据权利要求1所述的方法,其特征在于,所述将所述关键标记数据进行转换,得到关键信息区域包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述切点数据和所述全局文字数据进行局部数据提取,得到关键信息区域包括:
5.一种油田合同分析关键信息提取装置,其特征在于,包括:
6.根据权利要求5所述的装置,其特征在于,所述全局文字数据包括:合同正文文字数据、合同参数文字数据,其中,所述合同参数文字数据包括:合同页码数据、合同字体数据、合同间距数据。
7.根据权利要求5所述的装置,其特征在于,所述转换模块包括:
8.根据权利要求7所述的装置,其特征在于,所述提取单元包括:
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行权利要求1至4中任意一项所述的方法。
10.一种电子装置,其特征在于,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行权利要求1至4中任意一项所述的方法。