本发明属于核电,尤其涉及基于非限定实体、跨阶段的核电经验反馈查找方法及系统。
背景技术:
1、本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
2、经验反馈(exper ience feedback)是知识管理在核电领域内的一种专业称呼,是持续改进核电厂设备的质量水平、避免问题重复发生和保障核安全职责落实的重要手段,是核电厂安全的重要保障;从本质上来说,经验反馈是各类问题解决方案(也包含良好实践)的复用过程,是一种有明确目的的管理活动,经验反馈的最终目标是:避免当前情况下同类或类似不良事件、事故的发生,也防止其他无效、低效的活动发生。能够有效地对各种经验反馈数据进行再次利用是实现其最终目标的有效保障。
3、经验反馈数据的再利用主要是根据用户当前处理业务流程所提供的文本片段进行相近案例的查找,从而为用户提供历史经验反馈内容的借鉴和参考;因为整个数据库的经验反馈数据具有海量维度的这一特点,导致用户主动去查找历史经验反馈案例的效率低下、难度很大。从传统搜索或内容推送的技术上来讲,人们对查找结果的要求一般是对查询关键字要有结果上的回应,并按查找返回结果一一罗列即可。一些技术能力强的搜索引擎服务(比如谷歌)返回的结果会更进一步按相似性由高到低进行排序。传统搜索引擎可能一次性返回上万条内容,而且还需要人为进一步筛选出想要的结果。而核电经验反馈内容检索的目标是:找到与每一个实质内容相关的全部数据,且确保级别重要的经验反馈条目不能出现遗漏;同时,查找并返回的内容要高度相关,不能返回过多不相干的数据。综上所述,对内容查找的要求是:查找的结果要完整、准确且数量有限。这种经验反馈的查找要比传统搜索引擎的查找技术要求的更高。因此,目前通过组合式关键词过滤筛选等查找方式并不适合核电经验反馈案例的查找,常规的查找方式会导致查找的效果不佳。
技术实现思路
1、为克服上述现有技术的不足,本发明提供了基于非限定实体、跨阶段的核电经验反馈查找方法及系统,通过非限定实体、跨阶段,将查找不再局限于特定的实体、单一的阶段,实现完整、准确、有限的核电经验反馈查找。
2、为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
3、本发明第一方面提供了基于非限定实体、跨阶段的核电经验反馈查找方法。
4、基于非限定实体、跨阶段的核电经验反馈查找方法,从经验反馈库中查找与待查找文本相关的经验反馈案例,所述经验反馈案例的元数据包括案例描述文本、分类标签、实体名称和语义特征向量,分为三重筛选,具体为:
5、预测待查找文本的分类标签,通过分类标签对经验反馈库中的案例进行第一重筛选;
6、识别待查找文本中的实体名称,通过实体名称对第一重筛选后的案例进行非限定实体的第二重筛选;
7、从待查找文本中删除识别出来的实体名称,将删除后的文本编码成语义特征向量,基于语义特征向量间的相似度,对第二重筛选后的案例进行跨阶段的第三重筛选,得到最终的查找结果。
8、进一步的,所述经验反馈库中经验反馈案例的入库流程为:
9、获取审核通过的待入库的经验反馈案例;
10、对案例的案例描述文本进行分类推断,得到案例的分类标签;
11、对案例的案例描述文本进行实体名称的识别,得到案例所包含的实体名称;
12、对案例的案例描述文本进行编码,得到案例的特征向量;
13、将案例描述文本、分类标签、实体名称和特征向量作为经验反馈案例的元数据,保存到经验反馈库中。
14、进一步的,所述分类标签是利用自然语言处理分类算法机制,对待分类的文本进行分类预测而产生的;
15、所述编码是运用bert模型的字词嵌入技术,获得待编码文本的语义特征向量。
16、进一步的,所述实体的识别是通过命名实体名称的识别技术,识别文本中包含的设备名称、零部件名称。
17、进一步的,所述通过识别出来的实体名称对第一重筛选后的案例进行筛选,包括两种方式:完全不限定实体和只限定部分实体;
18、所述完全不限定实体是不通过实体名称进行筛选;
19、所述只限定部分实体是选择部分实体名称进行筛选。
20、进一步的,所述语义特征向量间的相似度,是通过分层可导航小世界算法和相似性度量公式计算的。
21、进一步的,所述跨阶段的第三重筛选,是对第二重筛选后的案例进行相似度排序,依据排序结果,删除相似度不超过阈值的无关案例,通过阈值的设定,将无关案例从同一阶段和跨阶段的案例中区分出来。
22、本发明第二方面提供了基于非限定实体、跨阶段的核电经验反馈查找系统。
23、基于非限定实体、跨阶段的核电经验反馈查找系统,从经验反馈库中查找与待查找文本相关的经验反馈案例,所述经验反馈案例的元数据包括案例描述文本、分类标签、实体名称和语义特征向量,包括第一重筛选模块、第二重筛选模块、第三重筛选模块:
24、第一重筛选模块,被配置为:预测待查找文本的分类标签,通过分类标签对经验反馈库中的案例进行第一重筛选;
25、第二重筛选模块,被配置为:识别待查找文本中的实体名称,通过实体名称对第一重筛选后的案例进行非限定实体的第二重筛选;
26、第三重筛选模块,被配置为:从待查找文本中删除识别出来的实体名称,将删除后的文本编码成语义特征向量,基于语义特征向量间的相似度,对第二重筛选后的案例进行跨阶段的第三重筛选,得到最终的查找结果。
27、本发明第三方面提供了计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第一方面所述的基于非限定实体、跨阶段的核电经验反馈查找方法中的步骤。
28、本发明第四方面提供了电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所述的基于非限定实体、跨阶段的核电经验反馈查找方法中的步骤。
29、以上一个或多个技术方案存在以下有益效果:
30、本发明通过非限定实体、跨阶段,将查找不再局限于特定的实体、单一的阶段,提高语义理解的搜索能力的同时,实现完整、准确、有限的核电经验反馈查找。
31、本发明利用命名实体识别技术,识别出文本中的实体名称,通过完全不限定实体和只限定部分实体两种方式,不限定或部分限定用于过滤的实体,实现非限定实体的筛选。
32、本发明采用分类标签+相似度排序相结合的筛选方式,将无关案例从同一阶段和跨阶段的案例中区分出来,实现跨阶段筛选。
33、本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
1.基于非限定实体、跨阶段的核电经验反馈查找方法,其特征在于,从经验反馈库中查找与待查找文本相关的经验反馈案例,所述经验反馈案例的元数据包括案例描述文本、分类标签、实体名称和语义特征向量,分为三重筛选,具体为:
2.如权利要求1所述的基于非限定实体、跨阶段的核电经验反馈查找方法,其特征在于,所述经验反馈库中经验反馈案例的入库流程为:
3.如权利要求2所述的基于非限定实体、跨阶段的核电经验反馈查找方法,其特征在于,所述分类标签是利用自然语言处理分类算法机制,对待分类的文本进行分类预测;
4.如权利要求1所述的基于非限定实体、跨阶段的核电经验反馈查找方法,其特征在于,所述实体名称的识别是通过命名实体名称的识别技术,识别文本中包含的设备名称、零部件名称。
5.如权利要求1所述的基于非限定实体、跨阶段的核电经验反馈查找方法,其特征在于,所述非限定实体的第二重筛选,包括两种方式:完全不限定实体和只限定部分实体;
6.如权利要求1所述的基于非限定实体、跨阶段的核电经验反馈查找方法,其特征在于,所述语义特征向量间的相似度,是通过分层可导航小世界算法和相似性度量公式计算的。
7.如权利要求1所述的基于非限定实体、跨阶段的核电经验反馈查找方法,其特征在于,所述跨阶段的第三重筛选,是对第二重筛选后的案例进行相似度排序,依据排序结果,删除相似度不超过阈值的无关案例,通过阈值的设定,将无关案例从同一阶段和跨阶段的案例中区分出来。
8.基于非限定实体、跨阶段的核电经验反馈查找系统,其特征在于,从经验反馈库中查找与待查找文本相关的经验反馈案例,所述经验反馈案例的元数据包括案例描述文本、分类标签、实体名称和语义特征向量,包括第一重筛选模块、第二重筛选模块、第三重筛选模块:
9.一种电子设备,其特征是,包括:
10.一种存储介质,其特征是,非暂时性地存储计算机可读指令,其中,当所述计算机可读指令由计算机执行时,执行权利要求1-7任一项所述的方法。