本申请涉及深度学习,具体而言,涉及一种大模型人机对话系统的修正方法、装置、设备及介质。
背景技术:
1、通常地,基于大语言模型(large language model,llm)的应用服务的输出是不可控的。若应用服务的输出不理想,则需要标注人员查看离线数据,标注更新后重新对大语言模型进行训练与测试,导致费事费力。因此,如何优化基于大语言模型的应用服务的修正过程,是本领域亟待解决的技术问题。
技术实现思路
1、本申请实施例的目的在于提供一种大模型人机对话系统的修正方法、装置、设备及介质,用以实现优化基于大语言模型的应用服务修正过程的技术效果。
2、本申请实施例第一方面提供了一种大模型人机对话系统的修正方法,所述人机对话系统包括多个代理agent模块;每个所述agent模块用于执行对应的对话任务;所述方法包括:
3、针对多个所述agent模块中的每个目标agent模块,将所述目标agent模块执行本轮目标任务后的输出结果发送至预设接口;其中,所述输出结果存储于预设的记忆模块;
4、从所述预设接口获取所述输出结果的修正结果;
5、将所述记忆模块中的所述输出结果更新为所述修正结果,以使所述人机对话系统利用所述修正结果执行在后任务。
6、在上述实现过程中,在人机对话系统的运行过程中即可及时发现每个agent模块的输出错误并及时更正,无需在发现整个系统的最终输出错误后再通过重新标注来重新训练与测试,因此大大提高了人机对话系统的修正效率,优化了修正过程。
7、进一步地,所述预设接口包括管理端与人机对话系统间的通信接口;所述从所述预设接口获取所述输出结果的修正结果,包括:
8、从所述预设接口获取管理员在所述管理端对所述输出结果的修正结果。
9、在上述实现过程中,通过预设接口向管理端发送各目标agent模块的输出数据,使得错误的输出数据可以及时地由管理员进行修正,从而无需在发现整个系统的最终输出错误后再通过重新标注来重新训练与测试,因此大大提高了人机对话系统的修正效率,优化了修正过程。
10、进一步地,所述方法还包括:
11、通过所述预设接口向所述管理端发送每个所述agent模块的输出结果、以及所述人机对话系统输出的应答数据。
12、在上述实现过程中,通过将每个agent模块的输出结果与应答数据一并发送至预设接口以向管理员展示,可以让管理员直观地发现人机对话系统走到哪一个agent模块的输出结果有问题。同时允许管理员实时修改目标agent模块的输出结果,使得管理员可及时干预有问题的输出结果。
13、进一步地,所述人机对话系统利用所述修正结果执行在后任务,包括:
14、通过所述目标agent模块利用所述修正结果执行下一轮所述目标任务。
15、在上述实现过程中,将目标agent模块的本轮目标任务的输出结果修正后,得到的修正结果作为记忆数据用于同一目标agent模块在下一轮目标任务的依据之一,确保了先一轮目标任务的输出结果的准确性,从而也确保了下一轮目标任务是依据正确的数据执行的,以提高人机对话系统的准确性。
16、进一步地,部分所述agent模块的输入数据为其他agent模块的输出结果;所述人机对话系统利用所述修正结果执行在后任务,包括:
17、通过所述目标agent模块的在后agent模块利用所述修正结果执行对应的对话任务。
18、在上述实现过程中,将目标agent模块的本轮目标任务的输出结果修正后,得到的修正结果作为记忆数据用于在后agent模块的对话任务的依据之一,确保了在先agent模块输出结果的准确性,从而也确保了在后agent模块是依据正确的数据执行的,以提高人机对话系统的准确性。
19、进一步地,针对每个所述agent模块,获取所述agent模块的输入数据;
20、从所述记忆模块中获取所述agent模块的记忆数据;
21、利用所述输入数据与所述记忆数据对所述agent模块进行训练。
22、在上述实现过程中,利用测试阶段里每个agent模块的输入数据与记忆数据作为训练样本,反过来对该agent模块进行训练,一方面可以让agent模块学习到大量的正确样本的特征,提高agent模块的准确性;另一方面系统测试阶段直接修正错误的输出结果,可以提到系统迭代效率。
23、进一步地,所述方法应用于销售场景,所述人机对话系统为销售系统。
24、在上述实现过程中,在销售系统上线之前对各个agent模块进行修正,无需在发现整个系统的最终输出错误后再通过重新标注来重新训练与测试,因此大大提高了销售系统的修正效率,优化了修正过程。
25、本申请实施例第二方面提供了一种大模型人机对话系统的修正装置,所述人机对话系统包括多个代理agent模块;每个所述agent模块用于执行对应的对话任务;所述装置包括:
26、发送模块,用于针对多个所述agent模块中的每个目标agent模块,将所述目标agent模块执行本轮目标任务后的输出结果发送至预设接口;其中,所述输出结果存储于预设的记忆模块;
27、获取模块,用于从所述预设接口获取所述输出结果的修正结果;
28、更新模块,用于将所述记忆模块中的所述输出结果更新为所述修正结果,以使所述人机对话系统利用所述修正结果执行在后任务。
29、本申请实施例第三方面提供了一种电子设备,所述电子设备包括:
30、处理器;
31、用于存储处理器可执行指令的存储器;
32、其中,所述处理器调用所述可执行指令时实现第一方面任一所述方法的操作。
33、本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实现第一方面任一所述方法的步骤。
1.一种大模型人机对话系统的修正方法,其特征在于,所述人机对话系统包括多个代理agent模块;每个所述agent模块用于执行对应的对话任务;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述预设接口包括管理端与人机对话系统间的通信接口;所述从所述预设接口获取所述输出结果的修正结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述人机对话系统利用所述修正结果执行在后任务,包括:
5.根据权利要求1所述的方法,其特征在于,部分所述agent模块的输入数据为其他agent模块的输出结果;所述人机对话系统利用所述修正结果执行在后任务,包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1-5任一所述的方法,其特征在于,所述方法应用于销售场景,所述人机对话系统为销售系统。
8.一种大模型人机对话系统的修正装置,其特征在于,所述人机对话系统包括多个代理agent模块;每个所述agent模块用于执行对应的对话任务;所述装置包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,所述计算机指令被处理器执行时实现权利要求1-7任一所述方法的步骤。