本公开涉及人工智能,尤其涉及一种投诉预测方法、模型训练方法及装置。
背景技术:
1、随着社会的不断进步,网络的使用不断方便的用户的生活。其中,在网络质量不满足用户的满意度时,用户可以对该网络进行投诉。例如当用户感觉发送成功一条信息的时长大于5秒时,用户可以确定该网络质量较差,可以该网络质量进行投诉。例如可以基于对目标设备的故障投诉信息预测用户是否对网络质量进行投诉。但是在该预测系统中仅考虑目标设备的故障状态信息,使得投诉预测的准确性较差。
技术实现思路
1、本公开提供一种投诉预测方法、模型训练方法及装置,以提供投诉预测机制,提高投诉预测的准确性。本公开的技术方案如下:
2、根据本公开实施例的第一方面,提供一种投诉预测方法,所述方法包括:
3、获取全量用户标识中任一用户标识对应的网络指标数据集合,所述网络指标数据集合包括网络节点设备对应的第一网络指标数据子集和/或通信介质对应的第二网络指标数据子集;
4、对所述网络指标数据集合进行预处理,得到处理后的网络指标数据集合;
5、将所述处理后的网络指标数据集合输入至第一预测模型进行预测,获取预测结果,其中,所述预测结果用于指示与所述任一用户标识在预设天数内针对网络质量的投诉概率。
6、根据一些实施例,所述方法还包括:
7、获取所述任一用户标识在预设天数内的投诉结果;
8、根据所述预测结果和所述投诉结果,对所述第一预测模型进行调整,得到调整后的第一预测模型。
9、根据本公开实施例的第二方面,提供一种模型训练方法,包括:
10、按照特征提取规则,对第一数据集合进行特征提取,获取第二数据集合,其中,所述第一数据集合包括至少一个网络投诉用户标识对应的第一网络质量数据子集和至少一个网络非投诉用户标识对应的第二网络质量数据子集;
11、根据获取到的第二预测模型对应的参数集合,对所述第二预测模型中的参数进行设置,获取到第三预测模型;
12、采用所述第二数据集合对第三预测模型进行训练,获取到第一预测模型。
13、根据一些实施例,所述按照特征提取规则,对第一数据集合进行特征提取,获取第二数据集合,包括:
14、对所述第一数据集合进行缺失值检测,剔除所述第一数据集合中存在缺失值的数据,获取到第三数据集合;
15、采用特征提取规则,对所述第三数据集合进行特征提取,获取第二数据集合;
16、按照数据集比例,获取所述第二数据集合中的训练数据子集和测试数据子集。
17、根据一些实施例,其中,所述第三预测模型为xgboost模型,采用所述第二数据集合对第三预测模型进行训练,获取到第一预测模型,包括:
18、采用所述第二数据集合,获取所述xgboost模型对应的模型误差;
19、采用所述第二数据集合,获取所述xgboost模型的结构误差;
20、根据所述模型误差和所述结构误差,获取所述xgboost模型对应的目标函数,获取到训练完成的xgboost模型。
21、根据一些实施例,所述方法还包括:
22、获取所述xgboost模型中任一xgboost节点对应的信息增益变化值;
23、在所述信息增益变化值大于第一阈值时,则分裂所述任一xgboost节点;
24、在所述信息增益变化值小于等于第二阈值时,则不分裂所述任一xgboost节点,其中,所述第一阈值大于等于所述第二阈值。
25、根据一些实施例,所述采用所述第二数据集合对第三预测模型进行训练,获取到第一预测模型,包括:
26、根据所述第二数据集合对应的集合大小,获取所述第二数据集合对应的搜索方式;
27、采用所述搜索方式和所述第二数据集合对所述第三预测模型进行训练,在所述第三预测模型的预测结果满足预测要求的情况下,获取到第一预测模型。
28、根据一些实施例,所述在所述第三预测模型的预测结果满足预测要求的情况下,获取到第一预测模型,包括:
29、获取所述第三预测模型对应的预测投诉结果;
30、根据所述第一数据集合对应的投诉结果和所述预测投诉结果,获取所述预测结果对应的准确率、精确率和召回率;
31、根据所述精确率、所述精确率对应的第一权重、所述召回率和所述召回率对应的第二权重,获取所述第三预测模型对应的分数;
32、在所述准确率、所述精确率、所述召回率和所述分数满足预测要求的情况下,确定获取到所述第一预测模型。
33、根据本公开实施例的第三方面,提供一种投诉预测装置,所述装置包括:
34、数据获取单元,用于获取全量用户标识中任一用户标识对应的网络指标数据集合,所述网络指标数据集合包括网络节点设备对应的第一网络指标数据子集和/或通信介质对应的第二网络指标数据子集;
35、数据处理单元,用于对所述网络指标数据集合进行预处理,得到处理后的网络指标数据集合;
36、投诉预测单元,用于将所述处理后的网络指标数据集合输入至第一预测模型进行预测,获取预测结果,其中,所述预测结果用于指示与所述任一用户标识在预设天数内针对网络质量的投诉概率。
37、根据本公开实施例的第四方面,提供一种模型训练装置,包括:
38、特征提取单元,用于按照特征提取规则,对第一数据集合进行特征提取,获取第二数据集合,其中,所述第一数据集合包括至少一个网络投诉用户标识对应的第一网络质量数据子集和至少一个网络非投诉用户标识对应的第二网络质量数据子集;
39、参数设置单元,用于根据获取到的第二预测模型对应的参数集合,对所述第三预测模型中的参数进行设置,获取到第三预测模型;
40、模型获取单元,用于采用所述第二数据集合对第三预测模型进行训练,获取到第一预测模型。
41、根据本公开实施例的第五方面,提供一种网络侧设备,包括:
42、处理器;
43、用于存储所述处理器可执行指令的存储器;
44、其中,所述处理器被配置为执行所述指令,以实现前述一方面中任一项所述的投诉预测方法和前述一方面中任一项所述的模型训练方法。
45、根据本公开实施例的第六方面,提供了一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述一方面中任一项所述的投诉预测方法和前述一方面中任一项所述的模型训练方法。
46、根据本公开实施例的第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现前述一方面中任一项所述的方法。
47、本公开的实施例提供的技术方案至少带来以下有益效果:
48、在一些或者相关实施例中,通过获取全量用户标识中任一用户标识对应的网络指标数据集合,所述网络指标数据集合包括网络节点设备对应的第一网络指标数据子集和/或通信介质对应的第二网络指标数据子集;对所述网络指标数据集合进行预处理,得到处理后的网络指标数据集合;将所述处理后的网络指标数据集合输入至第一预测模型进行预测,获取预测结果,其中,所述预测结果用于指示与所述任一用户标识在预设天数内针对网络质量的投诉概率。因此,可以提供一种投诉预测机制,可以根据上网的服务过程,逐层选取相关网络指标数据,可以减少仅基于目标设备的故障确定投诉预测使得投诉预测不准确的情况,可以提高预设天数内预测结果获取的准确性,提高投诉预测的准确性。
49、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
1.一种投诉预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.一种模型训练方法,其特征在于,包括:
4.根据权利要求3所述的方法,其特征在于,所述按照特征提取规则,对第一数据集合进行特征提取,获取第二数据集合,包括:
5.根据权利要求3所述的方法,其特征在于,其中,所述第三预测模型为xgboost模型,采用所述第二数据集合对第三预测模型进行训练,获取到第一预测模型,包括:
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
7.根据权利要求2所述的方法,其特征在于,所述采用所述第二数据集合对第三预测模型进行训练,获取到第一预测模型,包括:
8.根据权利要求7所述的方法,其特征在于,所述在所述第三预测模型的预测结果满足预测要求的情况下,获取到第一预测模型,包括:
9.一种投诉预测装置,其特征在于,所述装置包括:
10.一种模型训练装置,其特征在于,包括:
11.一种网络侧设备,其特征在于,包括:
12.一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至2中任一项所述的投诉预测方法以及2至3中任一项所述的模型训练方法。