本申请涉及网络运维,尤其涉及一种信息处理方法、装置、设备、存储介质及计算机程序产品。
背景技术:
1、随着新一代宽带和无线网络的发展,现网中接入网络的设备和终端侧的设备越来越多;考虑到项目建设和用户的自身需求,运营商与合作方共同提供在边缘侧或者用户侧的网络接入方案,甚至用户自组网、自部署网络设备的情况也越来越多。对于此种情况,需要对接入网络的设备进行信息挖掘,以辅助用户及时发现老旧差情况,提高应对投诉和故障诊断的效率,从而提高障碍排除效率和网络的主动运维效率,提升用户满意度。
2、然而,相关技术中,在对接入网络的设备进行信息挖掘的过程中,当面临网络设备的数量达到海量级别时,无法对海量的设备名称进行高效的聚类处理。
技术实现思路
1、为解决相关技术中存在的技术问题,本申请实施例提供一种信息处理方法、装置、设备、存储介质及计算机程序产品。
2、为达到上述目的,本申请实施例的技术方案是这样实现的:
3、第一方面,本申请实施例提供了一种信息处理方法,所述方法包括:
4、获取目标设备名称列表;所述目标设备名称列表包括一个或多个设备名称信息序列;
5、确定各设备名称信息序列的分词次序;所述分词次序表征对应的设备名称信息序列中各分词块的次序;
6、基于所述各设备名称信息序列的分词次序,确定所述各设备名称信息序列之间的相似度;
7、基于所述各设备名称信息序列之间的相似度,对所述目标设备名称列表中的所有设备名称进行聚类,得到设备名称聚类结果。
8、第二方面,本申请实施例还提供了一种信息处理装置,包括:
9、获取单元,用于获取目标设备名称列表;所述目标设备名称列表包括一个或多个设备名称信息序列;
10、第一确定单元,用于确定各设备名称信息序列的分词次序;所述分词次序表征对应的设备名称信息序列中各分词块的次序;
11、第二确定单元,用于基于所述各设备名称信息序列的分词次序,确定所述各设备名称信息序列之间的相似度;
12、聚类单元,用于基于所述各设备名称信息序列之间的相似度,对所述目标设备名称列表中的所有设备名称进行聚类,得到设备名称聚类结果。
13、第三方面,本申请实施例还提供了一种信息处理设备,包括:处理器和用于存储能够在所述处理器上运行的计算机程序的存储器;
14、其中,所述处理器用于运行所述计算机程序时,执行本申请实施例所述的信息处理方法的步骤。
15、第四方面,本申请实施例还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例所述的信息处理方法的步骤。
16、第五方面,本申请实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本申请实施例所述的信息处理方法的步骤。
17、本申请实施例提供的信息处理方法、装置、设备、存储介质及计算机程序产品,获取目标设备名称列表;所述目标设备名称列表包括一个或多个设备名称信息序列;确定各设备名称信息序列的分词次序;所述分词次序表征对应的设备名称信息序列中各分词块的次序;基于所述各设备名称信息序列的分词次序,确定所述各设备名称信息序列之间的相似度;基于所述各设备名称信息序列之间的相似度,对所述目标设备名称列表中的所有设备名称进行聚类,得到设备名称聚类结果。采用本申请实施例的方案,针对目标设备名称列表中存在海量的设备名称的情况,考虑到分词块的次序,基于分词块的次序对目标设备名称列表中的设备名称信息序列进行分词,以为后续的相似度计算提供分词次序参数,并基于计算的各设备名称信息序列之间的相似度对海量的设备名称进行聚类处理,从而能够提高海量设备名称聚类处理的效率。
1.一种信息处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定各设备名称信息序列的分词次序,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述各设备名称信息序列进行分词,得到所述各设备名称信息序列对应的一个或多个分词块,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述各设备名称信息序列中的字符的位置和类型,对所述各设备名称信息序列进行分词,得到所述各设备名称信息序列对应的一个或多个分词块,包括:
5.根据权利要求2所述的方法,其特征在于,所述对所述各设备名称信息序列对应的一个或多个分词块进行次序标记,得到所述各设备名称信息序列的分词次序,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述各设备名称信息序列的分词次序,确定所述各设备名称信息序列之间的相似度,包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述各设备名称信息序列的分词次序,对分词后的各设备名称信息序列进行分层级聚类,得到各分词次序对应的一个或多个分词子集合,包括:
8.根据权利要求7所述的方法,其特征在于,在所述对分词后的各设备名称信息序列进行分层级聚类,得到各分词次序对应的一个或多个分词子集合之后,所述方法还包括:
9.根据权利要求6所述的方法,其特征在于,所述基于所述各分词次序对应的一个或多个分词子集合中各共同分词的相似度,确定所述各设备名称信息序列之间的相似度,包括:
10.根据权利要求6所述的方法,其特征在于,所述基于所述各分词次序对应的一个或多个分词子集合中各共同分词的相似度,确定所述各设备名称信息序列之间的相似度,包括:
11.一种信息处理装置,其特征在于,包括:
12.一种信息处理设备,其特征在于,包括:处理器和用于存储能够在所述处理器上运行的计算机程序的存储器;
13.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10任一项所述方法的步骤。
14.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现权利要求1至10任一项所述方法的步骤。