提示词生成方法、装置、设备、存储介质及程序产品与流程

    技术2025-01-07  38


    本技术涉及计算机,尤其涉及一种提示词生成方法、装置、设备、存储介质及程序产品。


    背景技术:

    1、目前,在大语言模型(large language model,llm)中,可以通过为用户输入的问题匹配提示词,提高对用户输入问题的回答的准确性。

    2、但是,当前大语言模型中的提示词提升回答准确性的能力较低,因此,缺少一种对提示词进行优化,进一步提升提示词提高回答准确性的能力的方法。


    技术实现思路

    1、本技术提供一种提示词生成方法、装置、设备、存储介质及程序产品,解决了相关技术中提示词提升回答准确性的能力较低的技术问题。

    2、第一方面,本技术提供一种提示词生成方法,包括:获取待输入第一大语言模型的目标问题和该目标问题对应的多个初始提示词;将该多个初始提示词和该目标问题输入该第一大语言模型,生成每个该初始提示词对应的目标答案;基于每个该初始提示词对应的目标答案,确定第一提示词对应的相似度信息;该相似度信息用于指示该第一提示词与其他提示词之间的相似度,该第一提示词为该多个初始提示词中任意一个,该其他提示词为该多个初始提示词中除该第一提示词以外的初始提示词;基于该第一提示词对应的相似度信息,更新该第一提示词,得到第二提示词。

    3、本技术中,由于第一提示词对应的相似度信息能够表征第一提示词和多个初始提示词中除第一提示词以外的初始提示词之间的相似程度,因此,通过该相似度信息更新该第一提示词,能够得到和多个初始提示词中除第一提示词以外的初始提示词之间的相似程度更高的第二提示词。如此,可以得到目标问题对应的多个用于提高大语言模型对目标问题回答准确度的提示词,并且该多个提示词相互之间的相似程度较高,可以j由于提示词之间存在冲突等负面影响导致的,对大语言模型生成的目标问题的答案的准确度降低的问题。

    4、可选地,该基于每个该初始提示词对应的目标答案,确定第一提示词对应的相似度信息,包括:基于每个该初始提示词对应的目标答案,确定目标相似度,该目标相似度为该第一提示词对应的目标答案与其他提示词对应的目标答案之间的相似度;将该目标相似度作为该第一提示词的相似度信息。

    5、本技术中,第一提示词对应的目标答案和第一提示词之间存在关联关系,第一提示词对应的目标答案和其他提示词对应的答案之间的相似度能够体现出第一提示词和其他提示词之间的相似程度,因此目标相似度可以准确地表征出第一提示词的相似度信息,因此将目标相似度作为第一提示词的相似度信息。

    6、可选地,该基于每个该初始提示词对应的目标答案,确定第一提示词对应的相似度信息,包括:获取每个该初始提示词对应的目标答案的第一特征向量;对于每个该目标答案,基于图神经网络和自注意力机制对该目标答案的第一特征向量进行处理,得到该目标答案的第二特征向量,以获取多个该第二特征向量;基于多个该第二特征向量,确定该第一提示词对应的相似度信息。

    7、本技术中,由于基于图神经网络和自注意力机制对目标答案的第一特征向量进行处理,得到的第二特征向量中包含了第一提示词对应的目标答案和其他提示词对应的目标答案之间的关联关系。因此,基于多个第二特征向量,可以准确、可靠地确定第一提示词对应的相似度信息。

    8、可选地,该图神经网络中包括每个该目标答案各自对应的节点,每个节点对应一个第一特征向量,该基于图神经网络和自注意力机制对该目标答案的第一特征向量进行处理,得到该目标答案的第二特征向量,包括:基于该图神经网络中与每个该节点对应的第一特征向量,确定包含每个该节点与该节点的相邻节点之间注意力权重的注意力权重矩阵;基于该注意力权重矩阵和该每个节点对应的第一特征向量,确定该目标答案的该第二特征向量。

    9、本技术中,相邻节点之间注意力权重的注意力权重矩阵中包含了每个节点的第一特征向量之间的注意力权重信息,该注意力权重信息能够指示每个节点之间的关联关系,因此,基于该注意力权重矩阵和每个节点对应的第一特征向量,可以准确地确定目标答案的第二特征向量。

    10、可选地,该基于多个该第二特征向量,确定该第一提示词对应的相似度信息,包括:将多个该第二特征向量输入交叉熵损失(cross entropy loss)确定函数,得到该第一提示词对应的交叉熵损失,该交叉熵损失用于指示该第一提示词对应的目标答案与该其他提示词对应的目标答案之间的相似程度;将多个该第二特征向量输入对比损失确定函数,得到该第一提示词对应对比损失,该对比损失用于指示该第一提示词对应的目标答案与该其他提示词对应的目标答案之间的相似程度,与该相似度阈值之间的差值;基于该交叉熵损失和该对比损失,确定该第一提示词对应的相似度信息。

    11、可选地,该基于该第一提示词对应的相似度信息,更新该第一提示词,得到第二提示词,包括:基于该交叉熵损失和该对比损失,更新该第一提示词,得到第三提示词;确定该第三提示词的交叉熵损失和该第三提示词的对比损失;基于该第三提示词的交叉熵损失和该第三提示词的对比损失均小于损失值阈值,将该第三提示词确定为第二提示词。

    12、本技术中,第三提示词的交叉熵损失和第三提示词的对比损失均小于损失值阈值,说明第三提示词和其他提示词之间的相似度较高,且第三提示词和其他提示词之间的相似度和相似度阈值之间的差值较小。此时,将第三提示词确定为第二提示词,可以准确、可靠地得到提高对目标问题回答能力更强的提示词。

    13、第二方面,本技术提供一种提示词生成装置,包括:获取模块、生成模块以及确定模块;该获取模块,用于获取待输入第一大语言模型的目标问题和该目标问题对应的多个初始提示词;该生成模块,用于将该多个初始提示词和该目标问题输入该第一大语言模型,生成每个该初始提示词对应的目标答案;该确定模块,用于基于每个该初始提示词对应的目标答案,确定第一提示词对应的相似度信息;该相似度信息用于指示该第一提示词与其他提示词之间的相似度,该第一提示词为该多个初始提示词中任意一个,该其他提示词为该多个初始提示词中除该第一提示词以外的初始提示词;该生成模块,还用于基于该第一提示词对应的相似度信息,更新该第一提示词,得到第二提示词。

    14、可选地,该确定模块,具体用于基于每个该初始提示词对应的目标答案,确定目标相似度,该目标相似度为该第一提示词对应的目标答案与其他提示词对应的目标答案之间的相似度;该确定模块,还具体用于将该目标相似度作为该第一提示词的相似度信息。

    15、可选地,该装置还包括处理模块;该获取模块,还用于获取每个该初始提示词对应的目标答案的第一特征向量;该处理模块,用于对于每个该目标答案,基于图神经网络和自注意力机制对该目标答案的第一特征向量进行处理,得到该目标答案的第二特征向量,以获取多个该第二特征向量;该确定模块,还具体用于基于多个该第二特征向量,确定该第一提示词对应的相似度信息。

    16、可选地,该图神经网络中包括每个该目标答案各自对应的节点,每个节点对应一个第一特征向量;该确定模块,还具体用于基于该图神经网络中与每个该节点对应的第一特征向量,确定包含每个该节点与该节点的相邻节点之间注意力权重的注意力权重矩阵;该确定模块,还具体用于基于该注意力权重矩阵和该每个节点对应的第一特征向量,确定该目标答案的该第二特征向量。

    17、可选地,该处理模块,还用于将多个该第二特征向量输入交叉熵损失确定函数,得到该第一提示词对应的交叉熵损失,该交叉熵损失用于指示该第一提示词对应的目标答案与该其他提示词对应的目标答案之间的相似程度;该处理模块,还用于将多个该第二特征向量输入对比损失确定函数,得到该第一提示词对应对比损失,该对比损失用于指示该第一提示词对应的目标答案与该其他提示词对应的目标答案之间的相似程度,与该相似度阈值之间的差值;该确定模块,还具体用于基于该交叉熵损失和该对比损失,确定该第一提示词对应的相似度信息。

    18、可选地,该生成模块,还用于基于该交叉熵损失和该对比损失,更新该第一提示词,得到第三提示词;该确定模块,还用于确定该第三提示词的交叉熵损失和该第三提示词的对比损失;该确定模块,还用于基于该第三提示词的交叉熵损失和该第三提示词的对比损失均小于损失值阈值,将该第三提示词确定为第二提示词。

    19、第三方面,本技术提供一种电子设备,包括:处理器和被配置为存储处理器可执行指令的存储器;其中,处理器被配置为执行所述指令,以实现上述第一方面中任一种可选地提示词生成方法。

    20、第四方面,本技术提供一种计算机可读存储介质,计算机可读存储介质上存储有指令,当该计算机可读存储介质中的指令由电子设备执行时,使得该电子设备能够执行上述第一方面中任一种可选地提示词生成方法。

    21、第五方面,本技术提供一种计算机程序产品,该计算机程序产品包括计算技术程序指令,该计算机程序指令被处理器执行时实现上述第一方面中任一种可选地提示词生成方法。

    22、本技术提供的提示词生成方法、装置、设备、存储介质及程序产品,获取待输入第一大语言模型的目标问题和该目标问题对应的多个初始提示词;将该多个初始提示词和该目标问题输入该第一大语言模型,生成每个该初始提示词对应的目标答案;基于每个该初始提示词对应的目标答案,确定第一提示词对应的相似度信息;该相似度信息用于指示该第一提示词与其他提示词之间的相似度,该第一提示词为该多个初始提示词中任意一个,该其他提示词为该多个初始提示词中除该第一提示词以外的初始提示词;基于该第一提示词对应的相似度信息,更新该第一提示词,得到第二提示词。本技术中,由于第一提示词对应的相似度信息能够表征第一提示词和多个初始提示词中除第一提示词以外的初始提示词之间的相似程度,因此,通过该相似度信息更新该第一提示词,能够得到和多个初始提示词中除第一提示词以外的初始提示词之间的相似程度更高的第二提示词。如此,可以得到目标问题对应的多个用于提高大语言模型对目标问题回答准确度的提示词,并且该多个提示词相互之间的相似程度较高,可以至少解决由于提示词之间存在冲突等负面影响导致的,对大语言模型生成的目标问题的答案的准确度降低的问题。


    技术特征:

    1.一种提示词生成方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的方法,其特征在于,所述基于每个所述初始提示词对应的目标答案,确定第一提示词对应的相似度信息,包括:

    3.根据权利要求1或2所述的方法,其特征在于,所述基于每个所述初始提示词对应的目标答案,确定第一提示词对应的相似度信息,包括:

    4.根据权利要求3所述的方法,其特征在于,所述图神经网络中包括每个所述目标答案各自对应的节点,每个节点对应一个第一特征向量,所述基于图神经网络和自注意力机制对所述目标答案的第一特征向量进行处理,得到所述目标答案的第二特征向量,包括:

    5.根据权利要求3所述的方法,其特征在于,所述基于多个所述第二特征向量,确定所述第一提示词对应的相似度信息,包括:

    6.根据权利要求5所述的方法,其特征在于,所述基于所述第一提示词对应的相似度信息,更新所述第一提示词,得到第二提示词,包括:

    7.一种提示词生成装置,其特征在于,所述装置包括获取模块、生成模块以及确定模块;

    8.一种电子设备,其特征在于,所述电子设备包括:

    9.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,当所述计算机可读存储介质中的指令由电子设备执行时,使得所述电子设备能够执行如权利要求1-6中任一项所述的提示词生成方法。

    10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算技术程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6中任一项所述的提示词生成方法。


    技术总结
    本申请提供一种提示词生成方法、装置、设备、存储介质及程序产品,涉及计算机技术领域,解决了相关技术中提示词提升回答准确性的能力较低的技术问题。该方法包括:获取待输入第一大语言模型的目标问题和该目标问题对应的多个初始提示词;将该多个初始提示词和该目标问题输入该第一大语言模型,生成每个该初始提示词对应的目标答案;基于每个该初始提示词对应的目标答案,确定第一提示词对应的相似度信息;相似度信息用于指示该第一提示词与其他提示词之间的相似度,第一提示词为该多个初始提示词中任意一个,该其他提示词为该多个初始提示词中除第一提示词以外的初始提示词;基于第一提示词对应的相似度信息,更新第一提示词,得到第二提示词。

    技术研发人员:韩赛,王泽林
    受保护的技术使用者:中国联合网络通信集团有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-24719.html

    最新回复(0)