一种小样本关系抽取方法、装置、终端和介质与流程

    技术2025-01-17  46


    本发明涉及人工智能,尤其涉及一种小样本关系抽取方法、装置、终端和介质。


    背景技术:

    1、目前,关系抽取任务主要有基于有监督学习的方法、基于远程监督学习的方法和基于小样本学习的方法三个研究方向。

    2、对于有监督学习的训练方法,由于训练数据集不易构建,因此在很多领域的使用受限制;采用远程监督的方法存在噪声,并且由于知识库长尾现象的存在,远程监督的方法并不能完全解决数据不足的问题。原型网络小样本学习是较为成功的方法,然而现有技术中,采用原型网络获得类原型的方式,没有考虑到关系抽取数据集中支持样例和查询样例所蕴含的全面信息,导致训练得到的类原型不够准确,影响最终分类结果的准确性。


    技术实现思路

    1、本发明实施例的目的是提供一种小样本关系抽取方法、装置、设备和介质,其能够考虑到关系抽取数据集中支持样例和查询样例之间的匹配信息,提高对类原型的训练精度,从而提高查询样例的分类结果的准确性。

    2、为实现上述目的,本发明实施例提供了一种小样本关系抽取方法,包括:

    3、获取关系抽取数据集;其中,所述关系抽取数据集包括支持样例集和查询样例,所述支持样例集包括至少一个候选类别和每一所述候选类别对应的至少一个支持样例;

    4、将每一所述支持样例和所述查询样例进行编码,得到每一所述支持样例和所述查询样例的每一个单词的初始向量;

    5、计算同一候选类别中的每一所述支持样例和所述查询样例之间的匹配度信息,将所述匹配度信息融合到所述候选类别中的每一所述支持样例和所述查询样例的每一个单词的初始向量中,得到每一所述支持样例和所述查询样例的每一个单词的最终向量;

    6、根据同一候选类别中的每一所述支持样例和所述查询样例的每一个单词的最终向量训练所述候选类别的类原型,以得到每一所述候选类别的类原型,并根据所述类原型计算得到所述查询样例的分类结果。

    7、作为上述方案的改进,所述计算同一候选类别中的每一所述支持样例和所述查询样例之间的匹配度信息,将所述匹配度信息融合到所述候选类别中的每一所述支持样例和所述查询样例的每一个单词的初始向量中,得到每一所述支持样例和所述查询样例的每一个单词的最终向量,包括:

    8、分别从支持样例的角度和查询样例的角度,计算同一候选类别中的所述支持样例和所述查询样例之间的匹配度矩阵,得到支持样例匹配度矩阵和查询样例匹配度矩阵;其中,所述支持样例匹配度矩阵包括所述支持样例的每一个单词分别与所述查询样例中的所有单词按匹配度进行加权平均的值;所述查询样例匹配度矩阵包括所述查询样例的每一个单词分别与所述支持样例中的所有单词按匹配度进行加权平均的值;

    9、将所述支持样例匹配度矩阵与由所述支持样例的每一个单词的初始向量构成的支持样例矩阵进行融合,得到所述支持样例的每一个单词的最终向量;

    10、将所述查询样例匹配度矩阵与由所述查询样例的每一个单词的初始向量构成的查询样例矩阵进行融合,得到所述查询样例的每一个单词的最终向量。

    11、作为上述方案的改进,所述将每一所述支持样例和所述查询样例进行编码,得到每一所述支持样例和所述查询样例的每一个单词的初始向量,包括:

    12、采用预设的语言训练模型对每一样例进行计算,得到每一所述样例的每一个单词的文本嵌入向量;其中,所述样例为所述支持样例和所述查询样例,所述单词为实体单词或非实体单词;

    13、根据预设的知识图谱,获取与每一所述样例中的实体单词相对应的知识图谱的实体的嵌入向量,作为每一所述样例中的实体单词的知识图谱嵌入向量;

    14、采用命名实体识别技术对每一所述样例中的实体单词进行识别,得到每一所述样例中的实体单词的命名实体识别向量;

    15、将每一所述样例中的实体单词的所述文本嵌入向量、所述知识图谱嵌入向量和所述命名实体识别向量进行融合,得到所述样例中的实体单词的初始向量,并将每一所述样例中的非实体单词进行向量补齐,得到每一所述样例中的非实体单词的初始向量。

    16、作为上述方案的改进,所述采用预设的语言训练模型对每一样例进行计算,得到每一所述样例的每一个单词的文本嵌入向量,包括:

    17、对每一所述样例分别进行分词处理、语义关系处理和位置识别处理,得到每一所述样例的每一个单词的字符嵌入、分句嵌入和位置嵌入;

    18、根据所述字符嵌入、所述分句嵌入和所述位置嵌入,计算得到每一所述样例的每一个单词的文本嵌入向量。

    19、作为上述方案的改进,所述采用预设的语言训练模型对每一样例进行计算,得到每一所述样例的每一个单词的文本嵌入向量,包括:

    20、对每一所述样例分别进行分词处理和位置识别处理,得到每一所述样例的每一个单词的字符嵌入和位置嵌入;

    21、根据所述字符嵌入和所述位置嵌入,计算得到每一所述单词对应的注意力权重;

    22、获取每一所述样例的每一个单词的绝对位置信息;

    23、根据所述注意力权重和所述绝对位置信息,计算得到每一所述样例的每一个单词的文本嵌入向量。

    24、作为上述方案的改进,所述根据预设的知识图谱,获取与每一所述样例中的实体单词相对应的知识图谱的实体的嵌入向量,作为每一所述样例中的实体单词的知识图谱嵌入向量,包括:

    25、获取预设的知识图谱中的实体集;其中,所述实体集是由所述知识图谱的每一个三元组中的头实体和尾实体构成的;

    26、将每一所述样例中的实体单词与所述知识图谱中相应的实体进行对齐;

    27、根据对齐结果对所述知识图谱中的实体进行采样;

    28、获取所采样的知识图谱的实体的嵌入向量,得到每一所述样例中的实体单词的知识图谱嵌入向量。

    29、作为上述方案的改进,所述根据同一候选类别中的每一所述支持样例和所述查询样例的每一个单词的最终向量训练所述候选类别的类原型,以得到每一所述候选类别的类原型,并根据所述类原型计算得到所述查询样例的分类结果,包括:

    30、从支持样例角度计算同一候选类别中的每一所述支持样例和所述查询样例之间的匹配度矩阵,得到所述候选类别中的每一所述支持样例的权重系数;

    31、根据所述权重系数计算所述候选类别的类原型,得到每一所述候选类别的类原型;

    32、将所述查询样例与每一所述类原型进行匹配计算,将匹配度最高的类原型作为所述查询样例的分类结果。

    33、本发明实施例提供了一种小样本关系抽取装置,包括:

    34、数据集获取模块,用于获取关系抽取数据集;其中,所述关系抽取数据集包括支持样例集和查询样例,所述支持样例集包括至少一个候选类别和每一所述候选类别对应的至少一个支持样例;

    35、初始向量计算模块,用于将每一所述支持样例和所述查询样例进行编码,得到每一所述支持样例和所述查询样例的每一个单词的初始向量;

    36、最终向量计算模块,用于计算同一候选类别中的每一所述支持样例和所述查询样例之间的匹配度信息,将所述匹配度信息融合到所述候选类别中的每一所述支持样例和所述查询样例的每一个单词的初始向量中,得到每一所述支持样例和所述查询样例的每一个单词的最终向量;

    37、类原型计算模块,用于根据同一候选类别中的每一所述支持样例和所述查询样例的每一个单词的最终向量训练所述候选类别的类原型,以得到每一所述候选类别的类原型,并根据所述类原型计算得到所述查询样例的分类结果。

    38、本发明实施例还提供了一种小样本关系抽取设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的小样本关系抽取方法。

    39、本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述任意一项所述的小样本关系抽取方法。

    40、与现有技术相比,本发明公开的小样本关系抽取方法、装置、终端和介质,通过对每一支持样例和查询样例编码成向量形式,再使用注意力机制对训练样本和查询样本进行交互,计算支持样例和查询样例之间的匹配度信息,并将匹配度信息融合到每一支持样例和查询样例的向量表示中,得到最终向量,根据每一支持样例和查询样例的最终向量进行类原型训练,从而在训练类原型时能够根据查询样例的不同得到更有利于分类的类原型,有效地提高了对类原型的训练精度,进而提高查询样例的分类结果的准确性。


    技术特征:

    1.一种小样本关系抽取方法,其特征在于,包括:

    2.如权利要求1所述的小样本关系抽取方法,其特征在于,所述计算同一候选类别中的每一所述支持样例和所述查询样例之间的匹配度信息,将所述匹配度信息融合到所述候选类别中的每一所述支持样例和所述查询样例的每一个单词的初始向量中,得到每一所述支持样例和所述查询样例的每一个单词的最终向量,包括:

    3.如权利要求1所述的小样本关系抽取方法,其特征在于,所述将每一所述支持样例和所述查询样例进行编码,得到每一所述支持样例和所述查询样例的每一个单词的初始向量,包括:

    4.如权利要求3所述的小样本关系抽取方法,其特征在于,所述采用预设的语言训练模型对每一样例进行计算,得到每一所述样例的每一个单词的文本嵌入向量,包括:

    5.如权利要求3所述的小样本关系抽取方法,其特征在于,所述采用预设的语言训练模型对每一样例进行计算,得到每一所述样例的每一个单词的文本嵌入向量,包括:

    6.如权利要求3所述的小样本关系抽取方法,其特征在于,所述根据预设的知识图谱,获取与每一所述样例中的实体单词相对应的知识图谱的实体的嵌入向量,作为每一所述样例中的实体单词的知识图谱嵌入向量,包括:

    7.如权利要求1至6任一项所述的小样本关系抽取方法,其特征在于,所述根据同一候选类别中的每一所述支持样例和所述查询样例的每一个单词的最终向量训练所述候选类别的类原型,以得到每一所述候选类别的类原型,并根据所述类原型计算得到所述查询样例的分类结果,包括:

    8.一种小样本关系抽取装置,其特征在于,包括:

    9.一种小样本关系抽取设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的小样本关系抽取方法。

    10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至7中任意一项所述的小样本关系抽取方法。


    技术总结
    本发明公开了一种小样本关系抽取方法、装置、设备和介质,通过获取关系抽取数据集,包括支持样例集和查询样例,所述支持样例集包括至少一个候选类别和每一所述候选类别对应的至少一个支持样例;将每一所述支持样例和所述查询样例进行编码得到初始向量;计算同一候选类别的支持样例和查询样例之间的匹配度信息,将所述匹配度信息融合到初始向量中,得到每一所述支持样例和所述查询样例的最终向量;根据每一所述支持样例和所述查询样例的最终向量得到每一所述候选类别的类原型,计算得到所述查询样例的分类结果。采用本发明,能够考虑到支持样例和查询样例之间的匹配信息,提高对类原型的训练精度,提高查询样例的分类结果的准确性。

    技术研发人员:徐辉,陈炳成,杨海军,汪玮,郝锦瑄
    受保护的技术使用者:中移(上海)信息通信科技有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-25093.html

    最新回复(0)