多智能体思维链协商增强生成方法

技术2026-05-14 8

本发明涉及人工智能，具体涉及一种多智能体思维链协商增强生成方法。

背景技术：

1、当前，大语言模型已经取得了较为深远的突破的发展，并且在各个领域中展示出了强大的文字生成能力。并且各个组织都对大语言模型私有化部署的需求，但是大语言模型需要较高的硬件部署条件，当硬件较差时只能部署低参数量的大语言模型。但是，低参数量的大模型一般性能较差，生成的内容还存在一些局限性，例如生成的内容可能不够准确、缺乏多样性、思考过于简单等问题。这可能是由于训练语料的质量较差、模型本身的性能不强等各种原因。

2、为了解决这些问题，许多研究者提出了各类方法来增强生成内容的效果，如思维链的方法、检索增强生成(rag)的方法等。在大语言模型中使用思维链模仿了人类的计划、组织、协调、控制等思维方法，并且也赋予了大语言模型使用工具的能力，可以让其通过查询资料、运行代码等操作提供额外的信息给大语言模型，进而加强了大语言模型的内容生成效果。其中的检索增强生成的方法有许多种，可以通过对比用户问题和私有资料库段落的相似程度，也可以通过把用户提出的问题和向量数据库对比，召回出最相似的资料，提供给大语言模型来增强内容生成的质量。

3、但是以上的研究都只是使用单一的大语言模型，通过各种方式来增强内容生成的效果。大语言模型自主构造的思维链虽然可以有效提高内容生成的质量，但使用同一个大语言模型通常是有着固定的思维倾向、缺乏灵活性和自适应性。经过对比发现，不同的大语言模型有着不同的思维倾向、知识库体量和不同的能力。因此，亟需一种采用不同的大语言模型进行增强和交互，提升生成内容质量的方法。

技术实现思路

1、本发明提出了一种多智能体思维链协商增强生成方法，以解决采用同一个大语言模型时，因为其固定的思维倾向、缺乏灵活性和自适应性，导致生成内容较差的技术问题。

2、为解决上述技术问题，本发明提供了一种多智能体思维链协商增强生成方法，包括以下步骤：

3、包括以下步骤：

4、步骤s1：通过若干个智能体构建多智能体系统，并为每个所述智能体创建个体思维链并挂载不同的大语言模型；

5、步骤s2：若干个所述智能体根据目标任务生成内容；

6、步骤s3：进行相互评价：若干个所述智能体之间通过个体思维链按照批判和完善的思维方式进行相互评价，智能体在接收到评价信息后重新修改生成内容；

7、步骤s4：通过步骤s3进行n轮迭代后，若干个所述智能体固化生成内容后，将若干个所述智能体的生成内容均发送给一个目标智能体，所述目标智能体对所有的生成内容进行总结和归纳，得到最终的生成结果。

8、优选地，步骤s2包括：设定用户的输入为目标任务，并在提示词中提供可以调用的工具说明；所述智能体的大语言模型根据所述目标任务和提示词生成执行的步骤；按照执行的步骤选定推理模块的先后关系和工具模块调用的工具类型和相关参数；依次执行对应的推理模块，所述推理模块通过思考模块进行思考后交给执行模块进行内容生成，最后将所有推理模块生成的内容进行连接并总结，得到生成内容。

9、3、根据权利要求1所述的一种多智能体思维链协商增强生成方法，其特征在于：步骤s3和步骤s4采用交互式协商的方法进行迭代并生成最终的结果。

10、优选地，所述交互式协商包括以下步骤：用户选择生成满意内容的若干个第一智能体，并要求其他的第二智能体进行评价；将第二智能体生成的评价反馈给第一智能体，并要求第一智能体进行修改得到新的生成内容；进行n轮迭代后，将若干个第一智能体生成的内容，指定一个第三智能体对内容进行总结和归纳，得到最终的生成结果。

11、优选地，第二智能体进行评价时通过自主构建提示词进行内容生成。

12、优选地，步骤s1中所述个体思维链采用以下方法构建：

13、1)构建任务目标提示词：请以“target”为任目标思考完成该任务的执行步骤，其中的“target”为用户输入的任务目标；

14、2)构建工具提示词：选择推理模块和工具模块，思考模块的参数为思考的主题，工具模块的参数为需要搜索的关键词；

15、3)构建系统内置提示词：请以markdown表格的格式输出需要执行的模块，表格中包括选择的模块和参数；

16、4)根据智能体的反馈内容，获取需要推理或查找的模块和对应参数，来构造个体思维链。

17、优选地，当所述工具模块需要调用代码运行时，进行如下操作：

18、1)通过智能体以给出的参数为目标生成对应的代码；

19、2)通过调用对应的环境和工具执行生成的代码；

20、3)当生成的代码无法执行时，重新执行工具模块生成代码；

21、4)当生成的代码第二次无法执行时，将执行代码所用到的软件终端反馈的信息重新发送给智能体，并根据错误信息要求重新生成代码；

22、5)当生成的代码运行成功时，将执行代码所用到的软件终端反馈的信息作为输入进入到智能体的历史对话中。

23、优选地，当步骤s4进行n轮迭代生成的内容低于期望时，剔除大语言模型对应的推理模块，或者精简流程，对个体思维链的结构进行重新编排，并调整在步骤s3中进行相互协商的智能体。

24、优选地，当步骤s4进行n轮迭代生成的内容低于期望时，添加用于关联网页或者本地文件的工具模块。

25、本发明还提供了一种大语言模型的思维链和协商链构建方法，用于上述个体思维链的构建，在进行相互评价时的流程构建；

26、采用拖拽式的建图方法，连接推理模块和工具模块；在推理模块中包含两个关键字段，分别是prompt和result字段，用于储存该模块的提示词和单模块推理出的结果；提供两种推理模块的大语言模型提示词构造模式，包括历史对话模式和单一提示词模式；在历史对话模式中，当前序模块挂载的大语言模型与本模块的大语言模型不相同时，则将前序模块的result字段作为该模块进行大语言模型推理时的user作用，其前序模块的推理结果作为用户记录进入到后续模块大语言模型推理的历史对话记录中，当前序模块挂载的大语言模型与本大语言模型相同时，则将前序模块的prompt字段作为该模块进行大语言模型推理时的user作用、result字段作为该模块进行大语言模型推理时的assistant作用，即前序模块的提示词和推理结果作为一般的历史对话记录关联到本模块；在单一提示词模式中，强制将所有的前序模块的result字段构造到本模块的prompt字段中；在工具模块中提供了“关联本地文件”和“搜索网络信息”的工具模块，这些模块作为前序模块关联到任意的推理模块中，由任意的推理模块主动创建需要的工具模块。

27、本发明的有益效果至少包括：

28、本发明的多智能体思维链协商增强生成方法可以通过计算机程序实现，并应用于大语言模型的内容增强生成、多智能体系统协同控制等领域。本发明提出的多智能体思维链协商增强生成方法，通过引入思维链模型和协商链，能够有效增强内容生成的协商效率和大语言模型生成内容的质量。特别是在硬件条件较差、显存较低导致大参数的大语言模型模型无法运行、算力不足、需要解决复杂任务、对生成的内容质量要求较高时，通过该方法综合利用各种大语言模型，能够充分发挥多个大语言模型的优势来增强生成结果。该技术方案具有广泛的应用前景和经济价值。

技术特征：

1.一种多智能体思维链协商增强生成方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种多智能体思维链协商增强生成方法，其特征在于：步骤s2包括：设定用户的输入为目标任务，并在提示词中提供可以调用的工具说明；所述智能体的大语言模型根据所述目标任务和提示词生成执行的步骤；按照执行的步骤选定推理模块的先后关系和工具模块调用的工具类型和相关参数；依次执行对应的推理模块，所述推理模块通过思考模块进行思考后交给执行模块进行内容生成，最后将所有推理模块生成的内容进行连接并总结，得到生成内容。

3.根据权利要求1所述的一种多智能体思维链协商增强生成方法，其特征在于：步骤s3和步骤s4采用交互式协商的方法进行迭代并生成最终的结果。

4.根据权利要求3所述的一种多智能体思维链协商增强生成方法，其特征在于：所述交互式协商包括以下步骤：用户选择生成满意内容的若干个第一智能体，并要求其他的第二智能体进行评价；将第二智能体生成的评价反馈给第一智能体，并要求第一智能体进行修改得到新的生成内容；进行n轮迭代后，将若干个第一智能体生成的内容，指定一个第三智能体对内容进行总结和归纳，得到最终的生成结果。

5.根据权利要求4所述的一种多智能体思维链协商增强生成方法，其特征在于：第二智能体进行评价时通过自主构建提示词进行内容生成。

6.根据权利要求1所述的一种多智能体思维链协商增强生成方法，其特征在于：步骤s1中所述个体思维链采用以下方法构建：

7.根据权利要求6所述的一种多智能体思维链协商增强生成方法，其特征在于：当所述工具模块需要调用代码运行时，进行如下操作：

8.根据权利要求6所述的一种多智能体思维链协商增强生成方法，其特征在于：当步骤s4进行n轮迭代生成的内容低于期望时，剔除大语言模型对应的推理模块，或者精简流程，对个体思维链的结构进行重新编排，并调整在步骤s3中进行相互协商的智能体。

9.根据权利要求1所述的一种多智能体思维链协商增强生成方法，其特征在于：当步骤s4进行n轮迭代生成的内容低于期望时，添加用于关联网页或者本地文件的工具模块。

10.一种大语言模型的思维链和协商链构建方法，其特征在于：用于权利要求1至权利要求9任意一项多智能体思维链协商增强生成方法中的个体思维链的构建，相互评价的流程构建；

技术总结
本发明提供了一种多智能体思维链协商增强生成方法：通过若干个智能体构建多智能体系统，并为每个所述智能体创建个体思维链并挂载不同的大语言模型；若干个所述智能体根据目标任务生成内容；进行相互评价：若干个所述智能体之间通过个体思维链按照批判和完善的思维方式进行相互评价，智能体在接收到评价信息后重新修改生成内容；进行N轮迭代后，若干个所述智能体固化生成内容后，将若干个所述智能体的生成内容均发送给一个目标智能体，所述目标智能体对所有的生成内容进行总结和归纳，得到最终的生成结果。综合利用各种大语言模型，能够充分发挥多个大语言模型的优势来增强生成结果。该技术方案具有广泛的应用前景和经济价值。

技术研发人员：文昊林,狄鹏,王松一,梁新,胡涛,陈童,杨丽丽
受保护的技术使用者：中国人民解放军海军工程大学
技术研发日：
技术公布日：2024/10/24

转载请注明原文地址:https://symbian.8miu.com/read-42881.html

专利

最新回复(0)