本发明涉及模型插件管理,特别是涉及一种基于插件的任务处理方法、装置、电子设备及存储介质。
背景技术:
1、大模型中插件的发展已经成为近年来ai(artificial intelligence,人工智能)技术的一个重要领域。这些插件的目标是扩展和增强大型语言模型(llms)的功能,使它们能够更好地与其他系统和数据进行集成,以及提供特定任务的定制解决方案。大模型插件的发展不仅仅是技术上的扩展,它们还在促进新的应用场景和业务模型的创新。
2、大模型中插件的发展正在推动技术边界的扩展,同时也为商业应用提供了新的可能性。随着技术的进步和市场的需求变化,预计未来会出现更多创新的插件,这些插件将进一步提升大模型的功能和适用性。
3、复杂性和维护成本:插件系统可能增加大模型的复杂性,这对于开发者和维护人员来说是一个挑战。每个插件可能需要单独的更新和维护,这不仅增加了成本,也可能导致系统稳定性和兼容性问题。
4、依赖性和兼容性问题:大模型与插件之间的依赖关系可能导致版本兼容性问题。当模型或插件升级时,可能需要确保所有组件都能协同工作。这种依赖性也可能限制了模型更新的灵活性。
5、可扩展性限制:随着插件数量的增加,管理和整合这些插件可能变得更加困难。大规模部署时,不同插件的相互作用可能导致预测性和行为的不确定性,这可能会限制系统的整体可扩展性和可靠性。
技术实现思路
1、鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于插件的任务处理方法、装置、电子设备及存储介质。
2、第一方面,本发明实施例公开了一种基于插件的任务处理方法,所述方法包括:
3、响应于接收到用户发起针对模型推理任务的请求信息,,获取所述模型推理任务匹配的上下文信息和目标插件对应的插件参数,所述目标插件为所述用户指示开启的插件;
4、基于所述请求信息、所述上下文信息和所述插件参数,生成第一请求数据;
5、调用第一插件基于所述第一插件的插件参数对所述第一请求数据进行前处理,得到第二请求数据;
6、调用模型推理引擎基于第二请求数据执行模型推理任务,得到第一推理响应数据;
7、调用第二插件对所述第一推理响应数据进行后处理,得到第二推理响应数据,并将所述第二推理响应数据发送给所述用户,其中,所述目标插件包括所述第一插件和所述第二插件。
8、可选地,在所述获取所述模型推理任务匹配的上下文信息和目标插件对应的插件参数之前,还包括:
9、接收所述用户发起的插件获取请求信息;
10、解析所述插件获取请求信息,得到待请求插件的插件标识;
11、调用预先设置的插件管理模块基于所述插件标识,从预设数据库中获取所述待请求插件的插件参数;
12、确定所述待请求插件的插件参数是否需要进行数据处理;
13、在确定所述待请求插件需要进行数据处理的情况下,对所述待请求插件的插件参数进行处理,得到处理插件参数;
14、将所述处理插件参数和所述插件标识发送给所述用户;;
15、接收用户针对所述处理插件参数的参数修改请求;
16、基于所述参数修改请求对所述处理插件参数进行修改,,得到所述待请求插件对应的修改后的插件参数;
17、将所述预设数据库中的所述待请求插件的插件参数替换为所述修改后的插件参数;
18、将所述待请求插件的所述修改后的插件参数和所述插件标识发送给所述用户。
19、可选地,所述对所述待请求插件的插件参数进行处理,得到处理插件参数,包括:
20、从数据库中检索所述待请求插件对应的处理数据,并基于所述处理数据和所述插件参数确定所述待请求插件的处理插件参数;和/或
21、对所述插件参数进行计算处理,得到所述待请求插件的处理插件参数;和/或
22、获取与所述待请求插件进行交互的外部系统信息,并基于所述外部系统信息和所述插件参数确定所述待请求插件的处理插件参数。
23、可选地,所述将所述待请求插件的所述修改后的插件参数和所述插件标识发送给所述用户,包括:
24、对所述修改后的插件参数和所述插件标识进行格式转换,得到格式转换后的插件数据,所述格式转换后的插件数据为适配用户端的数据;
25、将所述格式转换后的插件数据发送给所述用户。
26、可选地,所述获取所述模型推理任务匹配的上下文信息和目标插件对应的插件参数,包括:
27、接收用户发送的插件状态获取请求;
28、响应于所述插件状态获取请求,调用预先设置的插件管理模块获取预先存储于数据库中的所有插件的插件标识、所述所有插件的插件参数、及所述所有插件的插件状态信息;
29、将所述所有插件的插件标识、所述所有插件的插件参数、及所述所有插件的插件状态信息以插件列表形式发送给所述用户,以由所述用户从插件列表中选择所述目标插件并设置所述所有插件的插件状态信息。
30、可选地,所述第一插件为n个插件,n为大于1的正整数,
31、所述调用第一插件基于所述第一插件的插件参数对所述第一请求数据进行前处理,得到第二请求数据,包括:
32、依次调用所述n个插件中的当前插件基于所述当前插件的插件参数,对上一个插件进行数据处理得到的请求数据进行处理,得到中间请求数据,直至所述n个插件完成数据处理操作;
33、将所述n个插件中最后一个插件进行数据处理得到的请求数据作为所述第二请求数据;
34、所述n个插件中的第一个插件处理的请求数据为所述第一请求数据。
35、可选地,所述第二插件为m个插件,m为大于1的正整数,
36、所述调用第二插件对所述第一推理响应数据进行后处理,得到第二推理响应数据,包括:
37、依次调用所述m个插件中的当前插件基于所述当前插件的插件参数,对上一个插件进行数据处理得到的推理响应数据进行处理,,得到中间响应数据,直至所述m个插件完成数据处理操作;
38、将所述m个插件中最后一个插件进行数据处理得到的响应数据作为所述第二推理响应数据;
39、所述m个插件中的第一个插件处理的响应数据为所述第一推理响应数据。
40、第二方面,本发明实施例提供了一种基于插件的任务处理装置,所述装置包括:
41、插件参数获取模块,用于响应于接收到用户发起针对模型推理任务的请求信息,获取所述模型推理任务匹配的上下文信息和目标插件对应的插件参数,所述目标插件为所述用户指示开启的插件;
42、第一请求数据生成模块,用于基于所述请求信息、所述上下文信息和所述插件参数,生成第一请求数据;
43、第二请求数据获取模块,用于调用第一插件基于所述第一插件的插件参数对所述第一请求数据进行前处理,得到第二请求数据;
44、第一响应数据获取模块,用于调用模型推理引擎基于第二请求数据执行模型推理任务,得到第一推理响应数据;
45、第二响应数据获取模块,用于调用第二插件对所述第一推理响应数据进行后处理,得到第二推理响应数据,并将所述第二推理响应数据发送给所述用户,其中,所述目标插件包括所述第一插件和所述第二插件。
46、可选地,所述装置还包括:
47、插件请求接收模块,用于接收所述用户发起的插件获取请求信息;
48、插件标识获取模块,用于解析所述插件获取请求信息,得到待请求插件的插件标识;
49、请求插件参数获取模块,用于调用预先设置的插件管理模块基于所述插件标识,从预设数据库中获取所述待请求插件的插件参数;;
50、插件参数确定模块,用于确定所述待请求插件的插件参数是否需要进行数据处理;
51、处理插件参数获取模块,用于在确定所述待请求插件需要进行数据处理的情况下,对所述待请求插件的插件参数进行处理,得到处理插件参数;
52、处理插件参数发送模块,用于将所述处理插件参数和所述插件标识发送给所述用户;
53、参数修改请求接收模块,用于接收用户针对所述处理插件参数的参数修改请求;
54、修改插件参数获取模块,用于基于所述参数修改请求对所述处理插件参数进行修改,得到所述待请求插件对应的修改后的插件参数;
55、插件参数替换模块,用于将所述预设数据库中的所述待请求插件的插件参数替换为所述修改后的插件参数;
56、修改插件参数发送模块,用于将所述待请求插件的所述修改后的插件参数和所述插件标识发送给所述用户。
57、可选地,所述处理插件参数获取模块包括:
58、第一参数获取单元,用于从数据库中检索所述待请求插件对应的处理数据,并基于所述处理数据和所述插件参数确定所述待请求插件的处理插件参数;
59、第二参数获取单元,用于对所述插件参数进行计算处理,得到所述待请求插件的处理插件参数;
60、第三参数获取单元,用于获取与所述待请求插件进行交互的外部系统信息,并基于所述外部系统信息和所述插件参数确定所述待请求插件的处理插件参数。
61、可选地,所述修改插件参数发送模块包括:
62、参数格式转换单元,用于对所述修改后的插件参数和所述插件标识进行格式转换,得到格式转换后的插件数据,所述格式转换后的插件数据为适配用户端的数据;
63、格式转换参数发送单元,用于将所述格式转换后的插件数据发送给所述用户。
64、可选地,所述插件参数获取模块包括:
65、状态请求接收单元,用于接收用户发送的插件状态获取请求;
66、插件状态获取单元,用于响应于所述插件状态获取请求,调用预先设置的插件管理模块获取预先存储于数据库中的所有插件的插件标识、所述所有插件的插件参数、及所述所有插件的插件状态信息;
67、插件状态发送单元,用于将所述所有插件的插件标识、所述所有插件的插件参数、及所述所有插件的插件状态信息以插件列表形式发送给所述用户,以由所述用户从插件列表中选择所述目标插件并设置所述所有插件的插件状态信息。
68、可选地,所述第一插件为n个插件,n为大于1的正整数,
69、所述第二请求数据获取模块包括:
70、中间请求数据获取单元,用于依次调用所述n个插件中的当前插件基于所述当前插件的插件参数,对上一个插件进行数据处理得到的请求数据进行处理,得到中间请求数据,直至所述n个插件完成数据处理操作;
71、第二请求数据获取单元,用于将所述n个插件中最后一个插件进行数据处理得到的请求数据作为所述第二请求数据;
72、所述n个插件中的第一个插件处理的请求数据为所述第一请求数据。
73、可选地,所述第二插件为m个插件,m为大于1的正整数,
74、所述第二响应数据获取模块包括:
75、中间响应数据获取单元,用于依次调用所述m个插件中的当前插件基于所述当前插件的插件参数,对上一个插件进行数据处理得到的推理响应数据进行处理,得到中间响应数据,直至所述m个插件完成数据处理操作;
76、第二响应数据获取单元,用于将所述m个插件中最后一个插件进行数据处理得到的响应数据作为所述第二推理响应数据;
77、所述m个插件中的第一个插件处理的响应数据为所述第一推理响应数据。
78、第三方面,本发明还公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述的基于插件的任务处理方法的步骤。
79、第四方面,本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上述的基于插件的任务处理方法的步骤。
80、本发明实施例包括以下优点:
81、本发明实施例通过响应于接收到用户发起针对模型推理任务的请求信息,获取模型推理任务匹配的上下文信息和目标插件对应的插件参数,目标插件为用户指示开启的插件。基于请求信息、上下文信息和插件参数,生成第一请求数据。调用第一插件基于第一插件的插件参数对第一请求数据进行前处理,得到第二请求数据。调用模型推理引擎基于第二请求数据执行模型推理任务,得到第一推理响应数据。调用第二插件对第一推理响应数据进行后处理,得到第二推理响应数据,并将第二推理响应数据发送给用户,其中,目标插件包括第一插件和第二插件。本发明实施例通过插件的形式分拆管理复杂的功能,使整个架构的可扩展性更高,每个插件负责特定功能,新增或修改功能时只需调整相应插件,无需重构整个系统,因此可以避免插件系统增加大模型的复杂性的问题,降低插件维护成本,也提高了模型更新的灵活性。插件系统可以按需加载必要的功能模块,减少资源消耗,提高系统运行效率。
1.一种基于插件的任务处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述获取所述模型推理任务匹配的上下文信息和目标插件对应的插件参数之前,,还包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述待请求插件的插件参数进行处理,得到处理插件参数,包括:
4.根据权利要求2所述的方法,其特征在于,所述将所述待请求插件的所述修改后的插件参数和所述插件标识发送给所述用户,,包括:
5.根据权利要求1所述的方法,其特征在于,所述获取所述模型推理任务匹配的上下文信息和目标插件对应的插件参数,包括::
6.根据权利要求1所述的方法,其特征在于,所述第一插件为n个插件,n为大于1的正整数,
7.根据权利要求1所述的方法,其特征在于,所述第二插件为m个插件,m为大于1的正整数,
8.一种基于插件的任务处理装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的基于插件的任务处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于插件的任务处理方法的步骤。