本发明涉及机械设备维保,具体为面向机械设备维保的智能问答系统及方法。
背景技术:
1、随着人工智能技术的进一步发展,尤其是以chatgpt为代表的大语言模型的问世,其带来了令人振奋的文本生成能力,以至于现在的智能问答系统已经摒弃了原来基于召回排序架构模型,选择了更加自然的且无需事先构建答案库的生成式问答;而在钢铁行业设备维保问答这一领域,目前还是基于原来的召回排序架构设计的问答系统,其需要人为构建问答库,而问题的无穷性、多样性导致了事先不可能构建起完整的答案库,这会让回答准确性大打折扣;而且还需要耗费大量的人力物力。
2、本发明提供一种基于ai大语言模型的机械设备维保的智能问答系统及方法;其无需进行大模型的微调训练,又可以高效地进行维保手册文档的切换,并且结合ai大模型的prompt工程对用户的输入进行改写,得到更加准确的回答。
技术实现思路
1、针对现有技术的不足,本发明提供了面向机械设备维保的智能问答系统及方法,其无需进行大模型的微调训练,又可以高效地进行维保手册文档的切换,并且结合ai大模型的prompt工程对用户的输入进行改写,得到更加准确的回答。
2、为实现以上目的,本发明通过以下技术方案予以实现:面向机械设备维保的智能问答系统,包括知识库管理模块、向量知识库管理模块、问答过程管理模块、大模型管理模块以及权限管理模块,所述知识库管理模块用于进行文档知识库的管理,所述大模型管理模块用于进行大语言模型的管理,所述问答过程管理模块用于进行问答对话的管理,所述大模型管理模块用于处理问答过程管理模块所输入的问题,所述权限管理模块具备对不同用户的访问文档权限进行管理的能力。
3、优选的,所述知识库管理模块包括有上传、删除、下载、编辑、上线、下线等功能按钮,具备用户将知识文档上传到系统知识库、将系统中的上传完毕的文档进行删除、线上系统文档在线编辑以及将文档从系统下载到本地的功能,所述上线与下线按钮用于对所述向量数据库内向量化的文档进行处理。
4、优选的,所述大模型管理模块具备对系统的大语言模型进行选择的功能,配合所述知识库管理模块进行上线和下线等操作,并进一步管理大语言模型部署的集群数量、并发量、响应时间等。
5、优选的,所述问答过程管理模块包括用户问题输入、大模型回答、多轮对话样式、用户历史提问、展示热点提问等功能,并在获得模型回答后进行血缘分析,进行原始文档检索以及段落的流程,精确定位到依赖于回答的原始维保手册的段落位置。
6、优选的,所述权限管理模块通过不同工种与不同保密级别的原文档进行分类、设定权限,权限外人员无法访问权限外文档,大模型根据权限限制访问范围,避免权限外的人员通过模型对话来诱导进行泄密。
7、面向机械设备维保的智能问答方法,包括以下步骤:
8、步骤一、文档解析与提取:将维保知识文档解析成xml格式,并提取段落级文本数据;
9、步骤二、文本向量化:利用text2vec组件和选定的模型对段落文本进行向量化;
10、步骤三、信息存储:将文本的详细信息及其md5编码存储在mysql数据库中;
11、步骤四、向量数据库索引:将段落的md5编码和向量表征存入fa i ss向量数据库以建立索引;
12、步骤五、用户输入与检索:接收用户问题,向量化处理后在fa i ss中检索最相关的topn段落;
13、步骤六、prompt工程与模型回答:结合检索结果,通过prompt工程调整用户输入,然后利用大模型生成回答;
14、步骤七、血缘分析与结果展示:对模型的回答进行血缘分析,展示其依据的原始段落信息,并向用户展示这些信息。
15、优选的,所述步骤一中的文档解析与提取的具体步骤为:首先将获取到的原始的维保手册等文档进行解析,并按段落切割原始文档,将原文档分成各个段落,对每个段落记录原文档的位置信息,随后将对提取的段落文本进行md5编码。
16、优选的,所述步骤二中的向量化可选择text2vec包中bert、word2vec中任意一种模型进行向量化表征。
17、优选的,所述步骤六中prompt工程调整后生成的回答内容包括:依据提供的参考文件经过提示工程所生成的答案与参考文档。
18、优选的,所述步骤七中的血缘分析的具体步骤为:首先对大模型输出以及模型输入的topn原段落文档进行分词,随后进行判断,来确认所使用的文档并进行获取,根据对应的md5编码在mysq l中查找记录的原文档信息,完成血缘分析。
19、本发明提供了面向机械设备维保的智能问答系统及方法。具备以下有益效果:
20、本发明基于大模型的生成式的钢铁行业机械设备的维保类智能问答,可以为企业一线工人、技术人员、管理人员等提供方便快捷的问答,帮助企业提高效率、降低人力成本。
1.面向机械设备维保的智能问答系统,其特征在于,包括知识库管理模块、向量知识库管理模块、问答过程管理模块、大模型管理模块以及权限管理模块,所述知识库管理模块用于进行文档知识库的管理,所述大模型管理模块用于进行大语言模型的管理,所述问答过程管理模块用于进行问答对话的管理,所述大模型管理模块用于处理问答过程管理模块所输入的问题,所述权限管理模块具备对不同用户的访问文档权限进行管理的能力。
2.根据权利要求1所述的面向机械设备维保的智能问答系统,其特征在于,所述知识库管理模块包括有上传、删除、下载、编辑、上线、下线等功能按钮,具备用户将知识文档上传到系统知识库、将系统中的上传完毕的文档进行删除、线上系统文档在线编辑以及将文档从系统下载到本地的功能,所述上线与下线按钮用于对所述向量数据库内向量化的文档进行处理。
3.根据权利要求2所述的面向机械设备维保的智能问答系统,其特征在于,所述大模型管理模块具备对系统的大语言模型进行选择的功能,配合所述知识库管理模块进行上线和下线等操作,并进一步管理大语言模型部署的集群数量、并发量、响应时间等。
4.根据权利要求1所述的面向机械设备维保的智能问答系统,其特征在于,所述问答过程管理模块包括用户问题输入、大模型回答、多轮对话样式、用户历史提问、展示热点提问等功能,并在获得模型回答后进行血缘分析,进行原始文档检索以及段落的流程,精确定位到依赖于回答的原始维保手册的段落位置。
5.根据权利要求1所述的面向机械设备维保的智能问答系统,其特征在于,所述权限管理模块通过不同工种与不同保密级别的原文档进行分类、设定权限,权限外人员无法访问权限外文档,大模型根据权限限制访问范围,避免权限外的人员通过模型对话来诱导进行泄密。
6.面向机械设备维保的智能问答方法,使用如权利要求1~5任意一项所述的面向机械设备维保的智能问答系统,其特征在于,包括以下步骤:
7.根据权利要求6所述的面向机械设备维保的智能问答方法,其特征在于,所述步骤一中的文档解析与提取的具体步骤为:首先将获取到的原始的维保手册等文档进行解析,并按段落切割原始文档,将原文档分成各个段落,对每个段落记录原文档的位置信息,随后将对提取的段落文本进行md5编码。
8.根据权利要求6所述的面向机械设备维保的智能问答方法,其特征在于,所述步骤二中的向量化可选择text2vec包中bert、word2vec中任意一种模型进行向量化表征。
9.根据权利要求6所述的面向机械设备维保的智能问答方法,其特征在于,所述步骤六中prompt工程调整后生成的回答内容包括:依据提供的参考文件经过提示工程所生成的答案与参考文档。
10.根据权利要求6所述的面向机械设备维保的智能问答方法,其特征在于,所述步骤七中的血缘分析的具体步骤为:首先对大模型输出以及模型输入的topn原段落文档进行分词,随后进行判断,来确认所使用的文档并进行获取,根据对应的md5编码在mysql中查找记录的原文档信息,完成血缘分析。