本公开涉及计算机,尤其涉及一种网管日志分析方法及装置、电子设备和存储介质。
背景技术:
1、随着科学技术的发展,通信网络承载的业务越来越多。由于网络覆盖场景复杂、参数多等因素,网络变更需求也逐渐增加。相关技术中,网络变更操作是由需求方提供需求工单,对该需求工单进行人工审核后,操作维护中心(operation and maintenance center,omc)执行器执行网络变更操作并生成无线基站操作变更记录(即网管日志)。然而,人工审核需求工单的准确率较低,并且,在网络出现问题后,才通过人工分析该网络对应的历史网管日志来查找问题根源,导致网络变更操作对网络产生负面影响的情况较多。
技术实现思路
1、本公开提供一种网管日志分析方法及装置、电子设备和存储介质,以至少解决相关技术中网络变更操作对网络产生负面影响的情况较多的技术问题。本公开的技术方案如下:
2、根据本公开实施例的第一方面,提供一种网管日志分析方法,包括:
3、获取待分析网管日志以及所述待分析网管日志对应的操作信息集合,其中,所述操作信息集合包括操作账号信息、操作时间信息以及操作小区性能信息;
4、根据所述待分析网管日志对应的操作内容信息以及所述操作信息集合,构建变更操作特征集合,其中,所述变更操作特征集合包括时间特征、账号属性特征、账号时间特征、操作命令特征、操作小区性能特征;
5、将所述变更操作特征集合输入至目标网管日志分析模型中进行特征融合识别,得到所述待分析网管日志对应的分析结果,其中,所述分析结果包括所述待分析网管日志对应的违规操作概率。
6、可选的,在所述根据所述待分析网管日志对应的操作内容信息以及所述操作信息集合,构建变更操作特征集合之前,还包括:
7、将所述待分析网管日志输入至目标命名实体识别模型中进行命名实体识别,得到所述待分析网管日志对应的操作内容信息,其中,所述操作内容信息包括操作命令、小区名称、调整参数以及调整值。
8、可选的,在所述将所述待分析网管日志输入至目标命名实体识别模型中进行命名实体识别之前,还包括:
9、获取网管日志训练样本集合,并对所述网管日志训练样本集合中任一网管日志训练样本进行标注,得到标注后的网管日志训练样本集合;
10、根据所述标注后的网管日志训练样本集合对命名实体识别预训练模型的模型参数进行更新,得到目标命名实体识别模型。
11、可选的,所述根据所述待分析网管日志对应的操作内容信息以及所述操作信息集合,构建变更操作特征集合,包括:
12、根据所述操作内容信息构造操作命令特征,根据所述操作时间信息构造时间特征,根据所述操作账号信息构建账号属性特征;
13、根据所述操作账号信息和所述操作时间信息构建账号时间特征;
14、根据所述操作内容信息、所述操作小区性能信息和所述操作时间信息构建操作小区性能特征。
15、可选的,在所述将所述变更操作特征集合输入至目标网管日志分析模型中进行特征融合识别,得到所述待分析网管日志对应的分析结果之前,还包括:
16、获取变更操作特征数据集,并对所述变更操作特征数据集进行标签数据匹配,得到标注后的变更操作特征数据集,其中,所述标注后的变更操作特征数据集包括训练集和测试集;
17、根据所述训练集依次训练至少一棵决策树,直至满足训练暂停条件,得到梯度提升决策树分类训练模型;
18、根据所述测试集对所述梯度提升决策树分类训练模型进行迭代训练,直至满足测试暂停条件,得到目标网管日志分析模型,其中,所述目标网管日志分析模型包括至少一颗目标梯度提升决策树。
19、可选的,所述根据所述训练集依次训练至少一棵决策树,包括:
20、获取所述测试集对应的测试时间戳,以及所述训练集中任一训练样本对应的训练时间戳;
21、确定所述训练时间戳与所述测试时间戳之间的时长,根据所述时长确定所述任一训练样本对应的权重,得到所述训练集对应的权重集合;
22、根据所述训练集和所述权重集合依次加权训练至少一棵决策树。
23、可选的,所述根据所述训练集依次训练至少一棵决策树,包括:
24、在第一轮训练过程中,以所述训练集对应的违规操作概率真实值作为学习目标,根据所述训练集构建第一决策树,并确定所述第一决策树对应的第一残差,其中,所述第一残差由所述违规操作概率真实值以及所述第一决策树输出的违规操作概率预测值确定;
25、在第m+1轮训练过程中,以第m决策树对应的第m残差作为学习目标,根据所述训练集构建第m+1决策树,并确定所述第m+1决策树对应的第m+1残差,其中,m为正整数,所述第m+1残差由所述第m残差和所述第m+1决策树输出的违规操作概率预测值确定。
26、可选的,所述决策树的构建步骤包括:
27、确定所述训练集中至少一种变更操作特征对应的加权基尼系数,并以所述训练集作为根节点,选取加权基尼系数最小的变更操作特征递归地对所述训练集进行划分,直至满足划分停止条件,得到所述决策树。
28、可选的,所述确定所述训练集中至少一种变更操作特征对应的加权基尼系数,包括:
29、根据所述训练集,确定至少一种变更操作特征中任一变更操作特征对应的至少两个特征类别子集;
30、若所述特征类别样本子集中任一特征类别样本包括违规操作标签,则将所述特征类别样本子集放入第一样本集合中,并确定所述第一样本集合对应的划分比例值;
31、若所述特征类别样本子集中所有特征类别样本均不包括违规操作标签,则将所述特征类别样本子集放入第二样本集合中,并确定所述第二样本集合对应的划分比例值;
32、将划分比例值高的样本集合设置为左子女,并确定所述左子女对应的第一基尼系数;
33、将划分比例值低的样本集合设置为右子女,并确定所述右子女对应的第二基尼系数;
34、根据所述第一基尼系数和所述第二基尼系数,确定所述任一变更操作特征对应的加权基尼系数,得到至少一种变更操作特征对应的加权基尼系数。
35、可选的,所述将所述变更操作特征集合输入至目标网管日志分析模型中进行特征融合识别,得到所述待分析网管日志对应的分析结果,包括:
36、将所述变更操作特征集合输入至所述目标网管日志分析模型中每一颗目标梯度提升决策树中,得到所述至少一颗目标梯度提升决策树输出的违规操作概率预测值;
37、对所述至少一颗目标梯度提升决策树输出的违规操作概率预测值进行累加,得到所述待分析网管日志对应的违规操作概率。
38、可选的,所述将所述变更操作特征集合输入至所述目标网管日志分析模型中每一颗目标梯度提升决策树中,包括:
39、若所述变更操作特征集合中任一变更操作特征的特征类别为类别型,则对所述任一变更操作特征进行独热编码,得到编码后的变更操作特征集合;
40、对所述编码后的变更操作特征集合中的所有变更操作特征进行拼接,得到所述编码后的变更操作特征集合对应的特征向量;
41、将所述特征向量输入至所述目标网管日志分析模型中每一颗目标梯度提升决策树中。
42、根据本公开实施例的第二方面,提供一种网管日志分析装置,包括:
43、信息获取单元,用于获取待分析网管日志以及所述待分析网管日志对应的操作信息集合,其中,所述操作信息集合包括操作账号信息、操作时间信息以及操作小区性能信息;
44、特征构建单元,用于根据所述待分析网管日志对应的操作内容信息以及所述操作信息集合,构建变更操作特征集合,其中,所述变更操作特征集合包括时间特征、账号属性特征、账号时间特征、操作命令特征、操作小区性能特征;
45、特征识别单元,用于将所述变更操作特征集合输入至目标网管日志分析模型中进行特征融合识别,得到所述待分析网管日志对应的分析结果,其中,所述分析结果包括所述待分析网管日志对应的违规操作概率。
46、可选的,所述装置还包括实体识别单元,用于在所述根据所述待分析网管日志对应的操作内容信息以及所述操作信息集合,构建变更操作特征集合之前,具体用于:
47、将所述待分析网管日志输入至目标命名实体识别模型中进行命名实体识别,得到所述待分析网管日志对应的操作内容信息,其中,所述操作内容信息包括操作命令、小区名称、调整参数以及调整值。
48、可选的,所述实体识别单元用于在所述将所述待分析网管日志输入至目标命名实体识别模型中进行命名实体识别之前,还用于:
49、获取网管日志训练样本集合,并对所述网管日志训练样本集合中任一网管日志训练样本进行标注,得到标注后的网管日志训练样本集合;
50、根据所述标注后的网管日志训练样本集合对命名实体识别预训练模型的模型参数进行更新,得到目标命名实体识别模型。
51、可选的,所述特征构建单元用于根据所述待分析网管日志对应的操作内容信息以及所述操作信息集合,构建变更操作特征集合时,具体用于:
52、根据所述操作内容信息构造操作命令特征,根据所述操作时间信息构造时间特征,根据所述操作账号信息构建账号属性特征;
53、根据所述操作账号信息和所述操作时间信息构建账号时间特征;
54、根据所述操作内容信息、所述操作小区性能信息和所述操作时间信息构建操作小区性能特征。
55、可选的,所述装置还包括模型训练单元,用于在所述将所述变更操作特征集合输入至目标网管日志分析模型中进行特征融合识别,得到所述待分析网管日志对应的分析结果之前,具体用于:
56、获取变更操作特征数据集,并对所述变更操作特征数据集进行标签数据匹配,得到标注后的变更操作特征数据集,其中,所述标注后的变更操作特征数据集包括训练集和测试集;
57、根据所述训练集依次训练至少一棵决策树,直至满足训练暂停条件,得到梯度提升决策树分类训练模型;
58、根据所述测试集对所述梯度提升决策树分类训练模型进行迭代训练,直至满足测试暂停条件,得到目标网管日志分析模型,其中,所述目标网管日志分析模型包括至少一颗目标梯度提升决策树。
59、可选的,所述模型训练单元用于根据所述训练集依次训练至少一棵决策树时,具体用于:
60、获取所述测试集对应的测试时间戳,以及所述训练集中任一训练样本对应的训练时间戳;
61、确定所述训练时间戳与所述测试时间戳之间的时长,根据所述时长确定所述任一训练样本对应的权重,得到所述训练集对应的权重集合;
62、根据所述训练集和所述权重集合依次加权训练至少一棵决策树。
63、可选的,所述模型训练单元用于根据所述训练集依次训练至少一棵决策树时,具体用于:
64、在第一轮训练过程中,以所述训练集对应的违规操作概率真实值作为学习目标,根据所述训练集构建第一决策树,并确定所述第一决策树对应的第一残差,其中,所述第一残差由所述违规操作概率真实值以及所述第一决策树输出的违规操作概率预测值确定;
65、在第m+1轮训练过程中,以第m决策树对应的第m残差作为学习目标,根据所述训练集构建第m+1决策树,并确定所述第m+1决策树对应的第m+1残差,其中,m为正整数,所述第m+1残差由所述第m残差和所述第m+1决策树输出的违规操作概率预测值确定。
66、可选的,所述模型训练单元用于构建决策树时,具体用于:
67、确定所述训练集中至少一种变更操作特征对应的加权基尼系数,并以所述训练集作为根节点,选取加权基尼系数最小的变更操作特征递归地对所述训练集进行划分,直至满足划分停止条件,得到所述决策树。
68、可选的,所述模型训练单元用于确定所述训练集中至少一种变更操作特征对应的加权基尼系数时,具体用于:
69、根据所述训练集,确定至少一种变更操作特征中任一变更操作特征对应的至少两个特征类别子集;
70、若所述特征类别样本子集中任一特征类别样本包括违规操作标签,则将所述特征类别样本子集放入第一样本集合中,并确定所述第一样本集合对应的划分比例值;
71、若所述特征类别样本子集中所有特征类别样本均不包括违规操作标签,则将所述特征类别样本子集放入第二样本集合中,并确定所述第二样本集合对应的划分比例值;
72、将划分比例值高的样本集合设置为左子女,并确定所述左子女对应的第一基尼系数;
73、将划分比例值低的样本集合设置为右子女,并确定所述右子女对应的第二基尼系数;
74、根据所述第一基尼系数和所述第二基尼系数,确定所述任一变更操作特征对应的加权基尼系数,得到至少一种变更操作特征对应的加权基尼系数。
75、可选的,所述特征识别单元用于将所述变更操作特征集合输入至目标网管日志分析模型中进行特征融合识别,得到所述待分析网管日志对应的分析结果时,具体用于:
76、将所述变更操作特征集合输入至所述目标网管日志分析模型中每一颗目标梯度提升决策树中,得到所述至少一颗目标梯度提升决策树输出的违规操作概率预测值;
77、对所述至少一颗目标梯度提升决策树输出的违规操作概率预测值进行累加,得到所述待分析网管日志对应的违规操作概率。
78、可选的,所述特征识别单元用于将所述变更操作特征集合输入至所述目标网管日志分析模型中每一颗目标梯度提升决策树中时,具体用于:
79、若所述变更操作特征集合中任一变更操作特征的特征类别为类别型,则对所述任一变更操作特征进行独热编码,得到编码后的变更操作特征集合;
80、对所述编码后的变更操作特征集合中的所有变更操作特征进行拼接,得到所述编码后的变更操作特征集合对应的特征向量;
81、将所述特征向量输入至所述目标网管日志分析模型中每一颗目标梯度提升决策树中。
82、根据本公开实施例的第三方面,提供一种电子设备,包括:
83、处理器;
84、用于存储所述处理器可执行指令的存储器;
85、其中,所述处理器被配置为执行所述指令,以实现前述一方面中任一项所述的网管日志分析方法。
86、根据本技术的第四方面,提供了一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述一方面中任一项所述的网管日志分析方法。
87、根据本技术的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现前述一方面中任一项所述的方法。
88、综上,本公开实施例提供的方法,通过获取待分析网管日志以及待分析网管日志对应的操作信息集合,其中,操作信息集合包括操作账号信息、操作时间信息以及操作小区性能信息;根据待分析网管日志对应的操作内容信息以及操作信息集合,构建变更操作特征集合,其中,变更操作特征集合包括时间特征、账号属性特征、账号时间特征、操作命令特征、操作小区性能特征;将变更操作特征集合输入至目标网管日志分析模型中进行特征融合识别,得到待分析网管日志对应的分析结果,其中,分析结果包括待分析网管日志对应的违规操作概率。因此,通过构建待分析网管日志对应的变更操作特征集合,并控制目标网管日志分析模型对该变更操作特征集合进行识别,可以识别出变更操作属于违规操作的网管日志,以使网络变更操作员可以按照规范要求实施操作,从而可以保证网络的平稳运行,可以减少网络变更操作对网络产生的负面影响。
89、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
1.一种网管日志分析方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在所述根据所述待分析网管日志对应的操作内容信息以及所述操作信息集合,构建变更操作特征集合之前,还包括:
3.根据权利要求2所述的方法,其特征在于,在所述将所述待分析网管日志输入至目标命名实体识别模型中进行命名实体识别之前,还包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述待分析网管日志对应的操作内容信息以及所述操作信息集合,构建变更操作特征集合,包括:
5.根据权利要求1所述的方法,其特征在于,在所述将所述变更操作特征集合输入至目标网管日志分析模型中进行特征融合识别,得到所述待分析网管日志对应的分析结果之前,还包括:
6.根据权利要求5所述的方法,其特征在于,所述根据所述训练集依次训练至少一棵决策树,包括:
7.根据权利要求5所述的方法,其特征在于,所述根据所述训练集依次训练至少一棵决策树,包括:
8.根据权利要求7所述的方法,其特征在于,所述决策树的构建步骤包括:
9.根据权利要求8所述的方法,其特征在于,所述确定所述训练集中至少一种变更操作特征对应的加权基尼系数,包括:
10.根据权利要求5所述的方法,其特征在于,所述将所述变更操作特征集合输入至目标网管日志分析模型中进行特征融合识别,得到所述待分析网管日志对应的分析结果,包括:
11.根据权利要求10所述的方法,其特征在于,所述将所述变更操作特征集合输入至所述目标网管日志分析模型中每一颗目标梯度提升决策树中,包括:
12.一种网管日志分析装置,其特征在于,包括:
13.一种电子设备,其特征在于,包括:
14.一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至11中任一项所述的网管日志分析方法。
