本发明涉及人工智能,具体为一种基于大模型的智能报表在政务行业中的应用方法与系统。
背景技术:
1、随着政务行业的发展,数据处理和报表生成在政府部门中的应用越来越重要。
2、传统的报表生成方法通常需要人工进行数据收集、整理和分析,工作效率低下,且容易出错。其次,政务数据往往涉及到敏感信息和保密要求,报表生成过程中需要保证数据的安全性和隐私性。
3、因此,如何利用先进的技术提高政务行业报表生成的效率和准确性并确保政务数据的安全性和隐私性成为了一个亟待解决的问题。
技术实现思路
1、本发明的目的在于提供一种基于大模型的智能报表在政务行业中的应用方法与系统,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种基于大模型的智能报表在政务行业中的应用方法,所述方法包括以下步骤:
3、系统鉴权,确保使用系统的用户具有查询相应信息的权限;
4、筛选报表,从众多报表中找到符合用户需求的报表;
5、筛选字段,从大量的数据字段中筛选出相关的字段进行报表生成;
6、问题查询,将用户自然语言描述的问题转换为sql语句并执行查询操作;
7、数据处理与分析,将查询到的报表数据进行数据处理和分析。
8、优选的,系统鉴权的具体操作包括:
9、用户登录后,大模型提取用户问题的街道或区域信息,系统查询用户在系统中的权限设置,系统根据用户权限设置判断用户是否具备访问特定报表和操作的权限,系统为有权限的用户启动报表筛选模块,系统记录用户鉴权过程的相关信息。
10、优选的,筛选报表的具体操作包括:
11、系统连接数据库,获取数据表的schema及所有报表的名称;系统提取用户需要访问的关键信息;将用户问题关键信息和目标街道或区域的所有报表名称分别通过bge模型进行向量化;分别计算用户问题关键信息和目标街道或区域的各个报表名称之间的余弦相似度;将相似度最高的5个报表名称按照相似度从高到低进行排序,并在系统中展示给用户。
12、优选的,筛选字段的具体操作包括:
13、系统连接数据库,获取数据表的schema及目标报表的字段名称;提取用户需要访问的关键信息;将用户问题关键信息和目标报表的所有字段名称分别通过bge模型进行向量化;分别计算用户问题关键信息和目标报表的各个字段名称之间的余弦相似度;尝试设置不同的相似度阈值后固定一个合适的相似度阈值,使得所筛选的字段既不遗漏重要字段,也尽可能少地筛选到多余字段;系统展示所筛选的字段,由用户确认结果,若筛选的字段有偏差,则更换相似度阈值。
14、优选的,问题查询的具体操作包括:
15、将用户查询问题以及筛选到的报表的名称、schema和字段传入大模型中,模型解析出用户查询的意图及逻辑,然后生成相应的可执行的sql查询语句;系统校验生成的查询语句的语法是否正确,并确保查询逻辑符合业务规则和数据库结构;系统在数据库执行生成的sql语句;数据库执行完sql语句后,将查询结果返回给系统,或者将执行sql语句过程中的特殊情形向系统报告;
16、数据处理与分析的具体操作包括:
17、对查询到的数据进行预处理;选择合适的统计分析、数据挖掘或机器学习等方法对数据进行处理和分析,提取数据中的关键信息和趋势;通过交叉验证或其他技术来评估模型的性能;根据政务行业需求,将生成的报表以可视化的形式展示给用户,并提供下载、打印功能。
18、一种基于大模型的智能报表在政务行业中的应用系统,所述系统由鉴权模块、筛选报表模块、筛选字段模块、text2sql模块以及数据处理与分析模块组成;
19、鉴权模块,确保使用系统的用户具有查询相应信息的权限;
20、筛选报表模块,从众多报表中找到符合用户需求的报表;
21、筛选字段模块,从大量的数据字段中筛选出相关的字段进行报表生成;
22、text2sql模块,将用户自然语言描述的问题转换为sql语句并执行查询操作;
23、数据处理与分析模块,将查询到的报表数据进行数据处理和分析。
24、优选的,所述鉴权模块,用户登录后,大模型提取用户问题的街道或区域信息,系统查询用户在系统中的权限设置,系统根据用户权限设置判断用户是否具备访问特定报表和操作的权限,系统为有权限的用户启动报表筛选模块,系统记录用户鉴权过程的相关信息。
25、优选的,所述筛选报表模块,系统连接数据库,获取数据表的schema及所有报表的名称;系统提取用户需要访问的关键信息;将用户问题关键信息和目标街道或区域的所有报表名称分别通过bge模型进行向量化;分别计算用户问题关键信息和目标街道或区域的各个报表名称之间的余弦相似度;将相似度最高的5个报表名称按照相似度从高到低进行排序,并在系统中展示给用户。
26、优选的,所述筛选字段模块,系统连接数据库,获取数据表的schema及目标报表的字段名称;提取用户需要访问的关键信息;将用户问题关键信息和目标报表的所有字段名称分别通过bge模型进行向量化;分别计算用户问题关键信息和目标报表的各个字段名称之间的余弦相似度;尝试设置不同的相似度阈值后固定一个合适的相似度阈值,使得所筛选的字段既不遗漏重要字段,也尽可能少地筛选到多余字段;系统展示所筛选的字段,由用户确认结果,若筛选的字段有偏差,则更换相似度阈值。
27、优选的,所述text2sql模块,将用户查询问题以及筛选到的报表的名称、schema和字段传入大模型中,模型解析出用户查询的意图及逻辑,然后生成相应的可执行的sql查询语句;系统校验生成的查询语句的语法是否正确,并确保查询逻辑符合业务规则和数据库结构;系统在数据库执行生成的sql语句;数据库执行完sql语句后,将查询结果返回给系统,或者将执行sql语句过程中的特殊情形向系统报告;
28、数据处理与分析模块,对查询到的数据进行预处理;选择合适的统计分析、数据挖掘或机器学习等方法对数据进行处理和分析,提取数据中的关键信息和趋势;通过交叉验证或其他技术来评估模型的性能;根据政务行业需求,将生成的报表以可视化的形式展示给用户,并提供下载、打印功能。
29、与现有技术相比,本发明的有益效果是:
30、本发明提出的基于大模型的智能报表在政务行业中的应用方法与系统,实现自动化、智能化的报表生成,提高政务行业报表生成的效率和准确性。同时,该方法与系统还旨在考虑数据的安全性和隐私性保护,确保政务数据的安全和保密。通过结合大模型技术和政务行业,本发明旨在解决政务行业报表生成方法中存在的低效率、易出错以及缺乏数据安全性等问题,为政府部门提供一种高效、准确、安全的报表生成解决方案。
1.一种基于大模型的智能报表在政务行业中的应用方法,其特征在于:所述方法包括以下步骤:
2.根据权利要求1所述的一种基于大模型的智能报表在政务行业中的应用方法,其特征在于:系统鉴权的具体操作包括:
3.根据权利要求1所述的一种基于大模型的智能报表在政务行业中的应用方法,其特征在于:筛选报表的具体操作包括:
4.根据权利要求1所述的一种基于大模型的智能报表在政务行业中的应用方法,其特征在于:筛选字段的具体操作包括:
5.根据权利要求1所述的一种基于大模型的智能报表在政务行业中的应用方法,其特征在于:问题查询的具体操作包括:
6.一种根据权利要求1-5任意一项所述的基于大模型的智能报表在政务行业中的应用方法的基于大模型的智能报表在政务行业中的应用系统,其特征在于:所述系统由鉴权模块、筛选报表模块、筛选字段模块、text2sql模块以及数据处理与分析模块组成;
7.根据权利要求6所述的一种基于大模型的智能报表在政务行业中的应用系统,其特征在于:所述鉴权模块,用户登录后,大模型提取用户问题的街道或区域信息,系统查询用户在系统中的权限设置,系统根据用户权限设置判断用户是否具备访问特定报表和操作的权限,系统为有权限的用户启动报表筛选模块,系统记录用户鉴权过程的相关信息。
8.根据权利要求6所述的一种基于大模型的智能报表在政务行业中的应用系统,其特征在于:所述筛选报表模块,系统连接数据库,获取数据表的schema及所有报表的名称;系统提取用户需要访问的关键信息;将用户问题关键信息和目标街道或区域的所有报表名称分别通过bge模型进行向量化;分别计算用户问题关键信息和目标街道或区域的各个报表名称之间的余弦相似度;将相似度最高的5个报表名称按照相似度从高到低进行排序,并在系统中展示给用户。
9.根据权利要求6所述的一种基于大模型的智能报表在政务行业中的应用系统,其特征在于:所述筛选字段模块,系统连接数据库,获取数据表的schema及目标报表的字段名称;提取用户需要访问的关键信息;将用户问题关键信息和目标报表的所有字段名称分别通过bge模型进行向量化;分别计算用户问题关键信息和目标报表的各个字段名称之间的余弦相似度;尝试设置不同的相似度阈值后固定一个合适的相似度阈值,使得所筛选的字段既不遗漏重要字段,也尽可能少地筛选到多余字段;系统展示所筛选的字段,由用户确认结果,若筛选的字段有偏差,则更换相似度阈值。
10.根据权利要求6所述的一种基于大模型的智能报表在政务行业中的应用系统,其特征在于:所述text2sql模块,将用户查询问题以及筛选到的报表的名称、schema和字段传入大模型中,模型解析出用户查询的意图及逻辑,然后生成相应的可执行的sql查询语句;系统校验生成的查询语句的语法是否正确,并确保查询逻辑符合业务规则和数据库结构;系统在数据库执行生成的sql语句;数据库执行完sql语句后,将查询结果返回给系统,或