本申请涉及计算机,尤其涉及一种异常资产数据的确定方法及其装置。
背景技术:
1、随着it行业的不断发展,企业的it资产规模日益庞大,包括但不限于硬件设备、软件、网络设备等。为了有效管理和维护这些it资产,运维团队需要建立全面的it资产清单,并进行定期盘点,以及及时发现并解决潜在问题。
2、目前,常见的it资产盘点方法主要为手动盘点。手动盘点方法通常涉及人工逐一检查it资产清单与实际情况的一致性。这种方法存在着显著的劳动力成本高、耗时长、易出现疏漏和错误等问题,限制了其在大规模it环境下的适用性和效率。
技术实现思路
1、本公开提供一种异常资产数据的确定方法及其装置,以至少解决相关技术中手动盘点的劳动力成本高、耗时长、易出现疏漏和错误的问题。
2、本申请第一方面实施例提出了一种异常资产数据的确定方法,包括:获取多个时间段分别对应的资产数据集以及每个资产数据集对应的资产向量,资产数据集中包括至少两种数据类型的资产数据;基于离群度量算法对资产向量进行异常分析,获取第一异常资产向量;对资产向量进行逐时间段做差,获取多个资产差值向量;基于独异森林算法对多个资产差值向量进行异常分析,获取第二异常资产向量;根据第一异常资产向量和第二异常资产向量确定目标异常资产向量,并根据目标异常资产向量确定异常资产数据。
3、根据本申请的一个实施例,基于离群度量算法对资产向量进行异常分析,获取第一异常资产向量,包括:基于离群度量算法对资产向量进行异常分析,获取每个资产向量对应的第一分值;确定第一分值大于预设分值阈值的资产向量作为第一异常资产向量。
4、根据本申请的一个实施例,基于离群度量算法对资产向量进行异常分析,获取每个资产向量对应的第一分值时,对应的计算公式为:
5、
6、
7、上式中,d(w)表示资产向量w对应的链式距离,k表示近邻数量,d(ei)表示资产向量w和其第i个邻近资产向量的最短路径距离;cof(w)表示资产向量w对应的第一分值,d(o)表示资产向量o的链式距离,资产向量o为资产向量w的邻近资产向量,nk(w)表示资产向量w对应的k个邻近资产向量。
8、根据本申请的一个实施例,基于独异森林算法对多个资产差值向量进行异常分析,获取第二异常资产向量,包括:基于独异森林算法对多个资产差值向量进行异常分析,获取每个资产差值向量对应的第二分值;确定第二分值位于预设分值区间的资产差值向量对应的资产向量作为第二异常资产向量。
9、根据本申请的一个实施例,基于独异森林算法对多个资产差值向量进行异常分析,获取每个资产差值向量对应的第二分值时,对应的计算公式为:
10、
11、上式中,s(x)表示资产差值向量x的第二分值,h(x)表示资产差值向量x在所有独异树上的路径长度的集合,e(h(x))表示资产差值向量x在所有独异树上的路径长度的均值,k(n)表示与资产差值向量的数量有关的常数,用于对资产差值向量x的路径长度h(x)进行标准化处理。
12、根据本申请的一个实施例,获取多个时间段分别对应的资产数据集以及每个资产数据集对应的资产向量,包括:从资产数据库中抽取每个时间段各自对应的资产数据集,资产数据集中包括至少两种数据类型的资产数据;获取每个资产数据集所包含的每种数据类型的资产数据各自对应的多个维度的特征向量;针对每个资产数据集,对该资产数据集所对应的所有特征向量进行合并,获取该资产数据集对应的资产向量。
13、根据本申请的一个实施例,从资产数据库中抽取每个时间段各自对应的资产数据集之前,还包括:获取多种数据类型的资产数据;对资产数据进行数据去重,并对数据去重之后的资产数据进行数据格式化;基于数据类型,将数据格式化之后的资产数据分别存储至多个资产数据库,并对每个资产数据库中的资产数据进行归一化处理。
14、根据本申请的一个实施例,对资产数据进行数据去重,包括:针对任一数据类型,对该数据类型下的资产数据进行数据划分,获得该数据类型下的多个数据分片;通过哈希算法对每个数据分片计算哈希值;根据哈希值对每种数据类型下的资产数据进行数据去重。
15、根据本申请的一个实施例,异常资产数据的确定方法,还包括:定时获取资产数据;基于获得的资产数据对资产数据库进行更新。
16、根据本申请的一个实施例,根据第一异常资产向量和第二异常资产向量确定目标异常资产向量,并根据目标异常资产向量确定异常资产数据,包括:将第一异常资产向量和第二异常资产向量中发生重合的异常资产向量作为目标异常资产向量;获取目标异常资产向量对应的资产差值向量;对目标异常资产向量对应的资产差值向量进行数据分析,获取异常资产数据。
17、根据本申请的一个实施例,根据目标异常资产向量确定异常资产数据之后,还包括:根据异常资产数据,查询预设的知识库,获取异常解决策略。
18、本申请第二方面实施例提出了一种异常资产数据的确定装置,包括:向量获取模块,用于获取多个时间段分别对应的资产数据集以及每个资产数据集对应的资产向量,资产数据集中包括至少两种数据类型的资产数据;第一分析模块,用于基于离群度量算法对资产向量进行异常分析,获取第一异常资产向量;向量做差模块,用于对资产向量进行逐时间段做差,获取多个资产差值向量;第二分析模块,用于基于独异森林算法对多个资产差值向量进行异常分析,获取第二异常资产向量;异常确定模块,用于根据第一异常资产向量和第二异常资产向量确定目标异常资产向量,并根据目标异常资产向量确定异常资产数据。
19、本申请第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现如本申请第一方面实施例所述的异常资产数据的确定方法。
20、本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于实现如本申请第一方面实施例所述的异常资产数据的确定方法。
21、本申请第五方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本申请第一方面实施例所述的异常资产数据的确定方法。
22、本公开的实施例提供的技术方案至少带来以下有益效果:本申请结合离群度量算法和独异森林算法从密度和树的维度分析资产数据,快速、精准挖掘异常数据,实现一次性快速比对所有资产数据,精准挖掘最终异常资产数据,极大程度上降低人工成本、提高工作效率,有效保证输出结果的准确性和真实性。
23、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
1.一种异常资产数据的确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于离群度量算法对所述资产向量进行异常分析,获取第一异常资产向量,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于离群度量算法对所述资产向量进行异常分析,获取每个所述资产向量对应的第一分值时,对应的计算公式为:
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述基于独异森林算法对所述多个资产差值向量进行异常分析,获取第二异常资产向量,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于独异森林算法对所述多个资产差值向量进行异常分析,获取每个所述资产差值向量对应的第二分值时,对应的计算公式为:
6.根据权利要求5所述的方法,其特征在于,所述获取多个时间段分别对应的资产数据集以及每个所述资产数据集对应的资产向量,包括:
7.根据权利要求6所述的方法,其特征在于,所述从资产数据库中抽取每个所述时间段各自对应的资产数据集之前,还包括:
8.根据权利要求7所述的方法,其特征在于,所述对所述资产数据进行数据去重,包括:
9.根据权利要求8所述的方法,其特征在于,所述方法,还包括:
10.根据权利要求9所述的方法,其特征在于,所述根据所述第一异常资产向量和所述第二异常资产向量确定目标异常资产向量,并根据所述目标异常资产向量确定异常资产数据,包括:
11.根据权利要求1所述的方法,其特征在于,所述根据所述目标异常资产向量确定异常资产数据之后,还包括:
12.一种异常资产数据的确定装置,其特征在于,包括:
13.一种电子设备,包括:
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-11中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-11中任一项所述方法的步骤。