本发明涉及数据处理,具体涉及基于语义标注的知识图谱查询优化方法。
背景技术:
1、通过利用电力领域的论文等材料构建知识图谱,从而为电力从业人员提供查询对应的相关知识。然而,由于知识图谱的复杂性,在进行查询检索时无法快速从众多相关知识中检索出与查询最紧密的回复,往往存在回复延迟、查询结果与想要询问的项目匹配度不高的情况。现有技术存在着进行知识图谱查询时数据量大,查询响应速度慢的技术问题。
技术实现思路
1、本申请提供了基于语义标注的知识图谱查询优化方法,用于针对解决现有技术中进行知识图谱查询时数据量大,查询响应速度慢的技术问题。
2、鉴于上述问题,本申请提供了基于语义标注的知识图谱查询优化方法。
3、本申请的第一个方面,提供了基于语义标注的知识图谱查询优化方法,所述方法包括:
4、对目标知识图谱在历史查询窗口内的查询信息进行采集,获得历史查询数据集;
5、以查询项目为索引对所述历史查询数据集进行多用户查询数据提取,获得q个查询数据集合,其中,q个查询数据集合对应q个查询项目;
6、对所述q个查询数据集合进行语义识别分析,获得所述q个查询项目的q个语义理解复杂度;
7、遍历对q个查询数据集合进行关键词向量分析,生成q个项目关键词向量集;
8、根据所述q个语义理解复杂度和所述q个项目关键词向量集对所述目标知识图谱中的q个查询项目进行语义标注,获得语义标注结果;
9、对目标查询用户进行历史查询范畴分析,获得第一查询系数;
10、获取所述目标查询用户在当前时刻的查询信息,与所述q个查询项目进行匹配,并结合所述第一查询系数和所述语义标注结果,获得目标查询结果。
11、本申请的第二个方面,提供了基于语义标注的知识图谱查询优化系统,所述系统包括:
12、历史查询数据集获得模块,用于对目标知识图谱在历史查询窗口内的查询信息进行采集,获得历史查询数据集;
13、查询数据集合获得模块,用于以查询项目为索引对所述历史查询数据集进行多用户查询数据提取,获得q个查询数据集合,其中,q个查询数据集合对应q个查询项目;
14、理解复杂度获得模块,用于对所述q个查询数据集合进行语义识别分析,获得所述q个查询项目的q个语义理解复杂度;
15、关键词向量集生成模块,用于遍历对q个查询数据集合进行关键词向量分析,生成q个项目关键词向量集;
16、语义标注结果获得模块,用于根据所述q个语义理解复杂度和所述q个项目关键词向量集对所述目标知识图谱中的q个查询项目进行语义标注,获得语义标注结果;
17、第一查询系数获得模块,用于对目标查询用户进行历史查询范畴分析,获得第一查询系数;
18、查询结果获得模块,用于获取所述目标查询用户在当前时刻的查询信息,与所述q个查询项目进行匹配,并结合所述第一查询系数和所述语义标注结果,获得目标查询结果。
19、本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
20、本申请通过对目标知识图谱在历史查询窗口内的查询信息进行采集,获得历史查询数据集,然后以查询项目为索引对历史查询数据集进行多用户查询数据提取,获得q个查询数据集合,其中,q个查询数据集合对应q个查询项目,进而对q个查询数据集合进行语义识别分析,获得q个查询项目的q个语义理解复杂度,通过遍历对q个查询数据集合进行关键词向量分析,生成q个项目关键词向量集,然后根据q个语义理解复杂度和q个项目关键词向量集对目标知识图谱中的q个查询项目进行语义标注,获得语义标注结果,对目标查询用户进行历史查询范畴分析,获得第一查询系数,然后获取目标查询用户在当前时刻的查询信息,与q个查询项目进行匹配,并结合第一查询系数,获得目标查询结果。达到了利用语义标注对知识图谱查询进行优化,提升查询准确度和查询效率的技术效果。
1.基于语义标注的知识图谱查询优化方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,对所述q个查询数据集合进行语义识别分析,获得所述q个查询项目的q个语义理解复杂度,所述方法还包括:
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
6.如权利要求5所述的方法,其特征在于,基于所述训练准确度和验证准确度进行网络参数更新分析,获得网络参数更新指令,所述方法还包括:
7.如权利要求1所述的方法,其特征在于,对目标查询用户进行历史查询范畴分析,获得第一查询系数,所述方法还包括:
8.如权利要求1所述的方法,其特征在于,所述方法还包括:
9.基于语义标注的知识图谱查询优化系统,其特征在于,所述系统包括: