本发明涉及通信大数据处理,尤其涉及一种用户预测模型构建、用户预测方法、设备、介质和产品。
背景技术:
1、随着科技的发展,许多智能化、科技化的产品应运而生,运营商之间的竞争越来越激烈,为了充分发掘自身差异竞争力,运营商将用户满意度作为服务质量反馈的一个重要指标,因此,预测和识别用户对产品的满意程度或贬损程度成功关键需求。
2、目前,通过样本用户调研和模型训练的方式来实现对用户类型的识别。然而,目前的调研直接在全体样本用户中进行贬损用户的预测,导致数据集中无效样本较多、数据质量不高、调研效率较低、调研耗费成本较高、甚至导致预测结果存在偏差。
技术实现思路
1、本发明实施例的目的是提供一种用户预测模型构建、用户预测方法、设备、介质和产品,通过两个阶段模型的串联使用,缩小用户网络满意度的调研范围,过滤掉无效样本,提高用户预测的准确率。
2、为实现上述目的,本发明实施例提供了一种用户预测模型构建方法,包括:
3、获取样本用户数据;其中,所述样本用户数据包括若干个样本用户的用户类型和所述样本用户的若干个特征指标,所述样本用户分为易感用户或非易感用户的用户类型,所述易感用户还分为满意用户或贬损用户的用户类型;所述易感用户为对产品做出评价的用户,所述易感用户为不对产品做出评价的用户,所述满意用户为对产品做出满意评价的用户,所述贬损用户为对产品做出不满意评价的用户;
4、根据每一所述样本用户的所述特征指标和所述用户类型进行模型训练,以构建第一用户预测模型;所述第一用户预测模型用于识别易感用户;
5、根据所述每一所述易感用户的所述特征指标和所述用户类型进行模型训练,以构建第二用户预测模型;所述第二用户预测模型用于从所述易感用户中识别贬损用户。
6、作为上述方案的改进,在所述获取样本用户数据之后,所述方法还包括:
7、对所述样本用户数据进行数据预处理;其中,所述预处理包括:缺失数据处理、异常数据处理、数据归一化和数据去重处理。
8、作为上述方案的改进,所述根据每一所述样本用户的所述特征指标和所述用户类型进行模型训练,以构建第一用户预测模型,包括:
9、构建第一神经网络模型,并对所述第一神经网络模型进行网络参数初始化;
10、将所有所述样本用户数据划分为训练集和测试集,作为第一训练集和第一测试集;
11、根据所述第一训练集中的样本用户的若干个所述特征指标和所述用户类型,对所述第一神经网络模型进行模型训练,得到训练完成的第一用户预测模型;
12、根据所述第一测试集中的样本用户的若干个所述特征指标和所述用户类型,对所述第一用户预测模型进行模型评估,得到模型评估结果;
13、根据模型评估结果对所述第一用户预测模型进行更新。
14、作为上述方案的改进,所述根据所述第一训练集中的样本用户的若干个所述特征指标和所述用户类型,对所述第一神经网络模型进行模型训练,得到训练完成的第一用户预测模型,包括:
15、将所述第一训练集中的样本用户的若干个所述特征指标输入至所述第一神经网络模型中进行分类,得到预测用户类型;所述第一训练集中的样本用户的预测用户类型为易感用户或非易感用户;
16、根据所述第一训练集中的样本用户的真实用户类型和预测用户类型的对比,对所述第一神经网络模型的网络参数进行优化,直到满足预设的模型收敛条件,得到训练完成的第一用户预测模型。
17、作为上述方案的改进,在所述根据所述第一测试集中的样本用户的若干个所述特征指标和所述用户类型,对所述第一用户预测模型进行模型评估,得到模型评估结果之前,所述方法还包括:
18、根据每一所述特征指标在模型训练过程中的特征贡献度,计算每一所述特征指标的相对重要性分数;
19、依次以每一所述相对重要性得分作为分数阈值,获取相对重要性分数高于预设的分数阈值的特征指标作为备选特征指标,以此构建若干个备选特征指标集;
20、则所述根据所述第一测试集中的样本用户的若干个所述特征指标和所述用户类型,对所述第一用户预测模型进行模型评估,得到模型评估结果,包括:
21、根据所述若干个备选特征指标集,依次确定当前所述第一测试集中的样本用户的备选特征指标;
22、根据当前确定的所述第一测试集中的样本用户的所述备选特征指标和所述用户类型,对所述第一用户预测模型进行模型评估,以此得到采用每一所述备选特征指标集进行模型评估后的模型评估结果;
23、在所述得到模型评估结果之后,所述方法还包括:
24、根据采用每一所述备选特征指标集进行模型评估的所述模型评估结果,计算每一所述备选特征指标集的评价指标;
25、将所述评价指标最高的备选特征指标集中的所有备选特征作为目标特征指标;所述目标特征指标用于作为所述第一用户预测模型的输入值。
26、作为上述方案的改进,所述根据所述每一所述易感用户的所述特征指标和所述用户类型进行模型训练,以构建第二用户预测模型,包括:
27、构建第二神经网络模型,并对所述第二神经网络模型进行网络参数初始化;
28、将作为所述易感用户的样本用户数据划分为训练集和测试集,作为第二训练集和第二测试集;
29、根据所述第二训练集中的样本用户的若干个所述特征指标和所述用户类型,对所述第二神经网络模型进行模型训练,得到训练完成的第二用户预测模型;
30、根据所述第二测试集中的样本用户的若干个所述特征指标和所述用户类型,对所述第二用户预测模型进行模型评估,得到模型评估结果;
31、根据模型评估结果对所述第二用户预测模型进行更新。
32、作为上述方案的改进,所述第一用户预测模型和/或所述第二用户预测模型为lightgbm梯度提升决策树模型。
33、本发明实施例还提供了一种用户预测方法采用如上述任一项所述的用户预测模型构建方法所构建得到的第一用户预测模型和第二用户预测模型进行用户预测;所述用户预测方法包括:
34、获取待识别用户数据;其中,所述待识别用户数据包括待识别用户的若干个特征指标;
35、根据所述待识别用户的所述特征指标输入至所述第一用户预测模型进行分类,以确定所述待识别用户是否为易感用户;
36、当所述待识别用户为易感用户时,根据所述待识别用户的所述特征指标输入至所述第二用户预测模型进行分类,以确定所述待识别用户是否为贬损用户。
37、本发明实施例还提供了一种电子终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的用户预测模型构建方法,或如上述任意一项所述的用户预测方法。
38、本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述任意一项所述的用户预测模型构建方法,或如上述任意一项所述的用户预测方法。
39、本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序或计算机指令,所述计算机程序或所述计算机指令被处理器执行时实现如上述任意一项所述的用户预测模型构建方法,或如上述任意一项所述的用户预测方法。
40、与现有技术相比,本发明公开的用户预测模型构建、用户预测方法、设备、介质和产品,通过在全体样本用户中进行易感用户预测,以构建并训练得到第一用户预测模型,再通过在易感用户中进行贬损用户预测,以构建并训练得到第二用户预测模型,以便于在应用阶段通过两个模型的串联使用,实现对贬损用户的精准识别,有效地缩小用户网络满意度的调研范围,过滤掉无效样本,提高数据质量,提升调研效率;同时提高贬损用户识别的准确率,从而能够提前准确预测不满意用户,以便于通过关怀资源的投入降低用户的不满意度,提升用户的整体满意度。
1.一种用户预测模型构建方法,其特征在于,包括:
2.如权利要求1所述的用户预测模型构建方法,其特征在于,所述根据每一所述样本用户的所述特征指标和所述用户类型进行模型训练,以构建第一用户预测模型,包括:
3.如权利要求2所述的用户预测模型构建方法,其特征在于,所述根据所述第一训练集中的样本用户的若干个所述特征指标和所述用户类型,对所述第一神经网络模型进行模型训练,得到训练完成的第一用户预测模型,包括:
4.如权利要求2所述的用户预测模型构建方法,其特征在于,在所述根据所述第一测试集中的样本用户的若干个所述特征指标和所述用户类型,对所述第一用户预测模型进行模型评估,得到模型评估结果之前,所述方法还包括:
5.如权利要求1所述的用户预测模型构建方法,其特征在于,所述根据所述每一所述易感用户的所述特征指标和所述用户类型进行模型训练,以构建第二用户预测模型,包括:
6.如权利要求1至5任一项所述的用户预测模型构建方法,其特征在于,所述第一用户预测模型和/或所述第二用户预测模型为lightgbm梯度提升决策树模型。
7.如权利要求1至5任一项所述的用户预测模型构建方法,其特征在于,在所述获取样本用户数据之后,所述方法还包括:
8.一种用户预测方法,其特征在于,采用如权利要求1至7任一项所述的用户预测模型构建方法所构建得到的第一用户预测模型和第二用户预测模型进行用户预测;所述用户预测方法包括:
9.一种电子终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的用户预测模型构建方法,或如权利要求8所述的用户预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至7中任意一项所述的用户预测模型构建方法,或如权利要求8所述的用户预测方法。
11.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序或计算机指令,所述计算机程序或所述计算机指令被处理器执行时实现如权利要求1至7中任意一项所述的用户预测模型构建方法,或如权利要求8所述的用户预测方法。