数据资源目录分类方法、电子设备、存储介质及程序产品与流程

    技术2024-11-29  14


    本申请涉及计算机,尤其涉及一种数据资源目录分类方法、电子设备、存储介质及程序产品。


    背景技术:

    1、在目前的部门系统信息化过程中,对各种数据资源进行目录建设是一个必要的环节。对于各种类型的数据资源,包括不同种类的数据库库表、api(applicationprogramming interface,应用程序编程接口)接口资源、非结构化文件资源等等进行目录编制(编目),在目前的技术条件下,仍然依赖人工进行编码、分类等工作方式,对数据资源进行目录分类。

    2、针对该问题,现有技术中开始尝试使用大语言模型等人工智能技术进行辅助分类。然而,已有的大语言模型对于分类目录的变更支持不佳,如果在编目过程中,发现需要添加新的分类,或者调整已有的分类,则已有的大语言模型需要重新训练,导致对数据资源进行目录分类的效率较低。


    技术实现思路

    1、本申请实施例提供一种数据资源目录分类方法、电子设备、存储介质及程序产品,用以达到可以自动适配任意的分类规则和类目,且能够实时变更,提高分类效率的效果。

    2、第一方面,本申请实施例提供一种数据资源目录分类方法,包括:

    3、获取待分类的目标数据资源;

    4、对目标数据资源进行向量嵌入处理,得到目标数据资源对应的目标向量;

    5、将目标向量与向量资源库中的现有向量进行匹配,得到目标向量与每个现有向量的相似度;其中,向量资源库包括多个现有向量以及每个现有向量对应的分类;现有向量为现有数据资源经过向量嵌入处理得到,现有向量对应的分类为现有数据资源的分类;向量资源库为根据现有数据资源与现有数据资源的分类的变化更新的;

    6、根据目标向量与每个现有向量的相似度,在向量资源库中确定目标现有向量,目标现有向量与目标向量相似度最高且大于相似度阈值;

    7、输出目标现有向量对应的分类,得到目标数据资源对应的目录分类结果。

    8、在一种可能的实施方式中,向量资源库为通过如下方式进行更新的:

    9、监听现有数据资源以及现有数据资源对应的分类;

    10、当监听到存在新增的现有数据资源,则获取新增的数据资源对应的新增分类,并对新增的数据资源进行向量嵌入,得到新增的数据资源对应的新增向量;将新增向量及对应的分类存储如向量资源库;

    11、当监听到存在待删除的现有数据资源分类的删除,在向量资源库中删除对应的现有向量及其分类;

    12、当监听到现有数据资源对应的分类发生改变,在向量资源库中修改现有向量对应的分类。

    13、在一种可能的实施方式中,监听现有数据资源以及现有数据资源对应的分类,包括:

    14、获取接口调用信号,接口调用信号用于表征现有数据资源与现有数据资源的分类变化;

    15、基于接口调用信号,生成修改信息,修改信息用于指示修改向量资源库中对应的向量和/或对应的分类。

    16、在一种可能的实施方式中,方法还包括:

    17、当向量资源库中的所有现有向量与目标向量的相似度均小于相似度阈值,对目标数据资源进行问题生成处理,得到对应的目标问题;

    18、使用目标问题对大语言模型进行提问,得到大语言模型的回复结果,并将回复结果确定为目标数据资源的分类结果。

    19、在一种可能的实施方式中,对目标数据资源进行问题生成处理,得到对应的目标问题,包括:

    20、获取目标数据资源对应的第一变量;

    21、将第一变量与问题模板中的固定数据进行合并,得到对应的目标问题。

    22、在一种可能的实施方式中,问题模板中的固定数据包括现有数据资源的分类;

    23、方法还包括:

    24、实时监听现有数据资源对应的分类;

    25、当现有数据资源对应的分类发生变化,根据变化更新问题模板中的固定数据。

    26、第二方面,本申请实施例提供一种数据资源目录分类装置,包括:

    27、获取模块,用于获取待分类的目标数据资源;

    28、嵌入模块,用于对目标数据资源进行向量嵌入处理,得到目标数据资源对应的目标向量;

    29、匹配模块,用于将目标向量与向量资源库中的现有向量进行匹配,得到目标向量与每个现有向量的相似度;其中,向量资源库包括多个现有向量以及每个现有向量对应的分类;现有向量为现有数据资源经过向量嵌入处理得到,现有向量对应的分类为现有数据资源的分类;向量资源库为根据现有数据资源与现有数据资源的分类的变化更新的;

    30、确定模块,用于根据目标向量与每个现有向量的相似度,在向量资源库中确定目标现有向量,目标现有向量与目标向量相似度最高且大于相似度阈值;

    31、结果输出模块,用于输出目标现有向量对应的分类,得到目标数据资源对应的目录分类结果。

    32、第三方面,本申请实施例提供一种电子设备,包括:存储器,处理器;

    33、所述存储器存储计算机执行指令;

    34、所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如上第一方面和/或第一方面各种可能的实施方式。

    35、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上第一方面和/或第一方面各种可能的实施方式。

    36、第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上第一方面和/或第一方面各种可能的实施方式。

    37、本申请实施例提供的数据资源目录分类方法、电子设备、存储介质及程序产品,通过获取待分类的目标数据资源,对目标数据资源进行向量嵌入处理,将目标向量和向量资源库中的现有向量进行匹配,得到相似度最高的目标现有向量,使用目标现有向量对应的分类作为目标数据资源对应的分类结果;其中,向量资源库根据现有数据资源及其分类的变化自动更新的,达到可以自动适配任意的分类规则和类目,且能够实时变更,提高分类效率的效果。



    技术特征:

    1.一种数据资源目录分类方法,其特征在于,包括:

    2.根据权利要求1所述的方法,其特征在于,所述向量资源库为通过如下方式进行更新的:

    3.根据权利要求2所述的方法,其特征在于,所述监听所述现有数据资源以及所述现有数据资源对应的分类,包括:

    4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:

    5.根据权利要求4所述的方法,其特征在于,所述对所述目标数据资源进行问题生成处理,得到对应的目标问题,包括:

    6.根据权利要求5所述的方法,其特征在于,所述问题模板中的固定数据包括现有数据资源的分类;

    7.一种数据资源目录分类装置,其特征在于,包括:

    8.一种电子设备,其特征在于,包括:存储器,处理器;

    9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-6任一项所述的方法。

    10.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-6任一项所述的方法。


    技术总结
    本申请实施例提供一种数据资源目录分类方法、电子设备、存储介质及程序产品。该方法包括:获取待分类的目标数据资源;对目标数据资源进行向量嵌入处理,得到目标数据资源对应的目标向量;将目标向量与向量资源库中的现有向量进行匹配,得到目标向量与每个现有向量的相似度;其中,向量资源库为根据现有数据资源与现有数据资源的分类的变化更新的;根据目标向量与每个现有向量的相似度,在向量资源库中确定目标现有向量,目标现有向量与目标向量相似度最高且大于相似度阈值;输出目标现有向量对应的分类,得到目标数据资源对应的目录分类结果。该方法用以达到可以自动适配任意的分类规则和类目,且能够实时变更,提高分类效率的效果。

    技术研发人员:沈博,邓娅婷,吕烨,宋雨伦,李大中
    受保护的技术使用者:中国联合网络通信集团有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-22727.html

    最新回复(0)