本发明涉及数据处理领域,尤其涉及一种用户分类模型训练方法、装置、设备、存储介质和产品。
背景技术:
1、近年来,随着互联网发展,互联网企业需要对用户进行评估,从将用户划分为不同的用户群,针对不同的用户群提供不同的个性化服务,从而达到提高用户体验、降低运营开销、提高用户留存率等的目的。现有人群分类标签选择方法主要包括人工选择、主成分分析(principal component analysis,pca)和机器学习分类算法(如knn、决策树和svm)。但是,人工筛选方法效率比较低,且主观性强,存在个人倾向性,目标人群和特征选取的人存在误差;pca分析过程中需要保留较大方差的主要成分,由于方差筛选特征的过程中可能存在重要特征被筛掉的问题,导致准确性不能保证;机器学习通常容易出现过拟合,分类的特征群不够精准,细分颗粒度达不到生产要求,需要不停的调优调参,耗时多。
技术实现思路
1、本发明实施例的目的是提供一种用户分类模型训练方法、装置、设备、存储介质和产品,训练得到的用户分类模型能有效提高用户分类的效率和准确性。
2、为实现上述目的,本发明实施例提供了一种用户分类模型训练方法,包括:
3、构建数据域中用户的人际关系矩阵和特征相似度矩阵;
4、将所述人际关系矩阵和所述特征相似度矩阵进行拼接,得到用户信息矩阵;
5、基于所述用户信息矩阵训练自编码器;
6、对所述自编码器进行模型参数优化,得到用户分类模型。
7、作为上述方案的改进,所述构建数据域中用户的人际关系矩阵,包括:
8、从数据域中抽取用户的人际关系数据,并根据所述人际关系数据构建邻接矩阵;
9、采用信号传播方式对所述邻接矩阵进行信号源处理,得到人际关系矩阵。
10、作为上述方案的改进,所述构建数据域中用户的特征相似度矩阵,包括:
11、从数据域中抽取用户的特征关键词,并根据所述特征关键词构建特征信息矩阵;
12、基于所述特征信息矩阵构建用户的特征相似度矩阵。
13、作为上述方案的改进,所述基于所述用户信息矩阵训练自编码器,包括:
14、将所述用户信息矩阵中的每一行数据作为输入特征,将所述输入特征输入到自编码器中;
15、通过逆向解码得到自编码器的输出特征;
16、最小化所述输出特征和所述输入特征的重构误差。
17、作为上述方案的改进,在基于所述用户信息矩阵训练自编码器后,所述方法还包括:
18、获取自编码器的隐藏层特征,根据所述隐藏层特征和用户之间的特征向量构建一阶相似性损失函数;
19、根据所述输入特征和所述输出特征定义二阶相似性损失函数;
20、将所述一阶相似性损失函数与所述二阶相似性损失函数进行综合得到目标函数。
21、作为上述方案的改进,所述对所述自编码器进行模型参数优化,
22、获取自编码器的隐藏层特征,并计算所述隐藏层特征和聚类中心的相似度;
23、定义辅助目标分布,并利用所述辅助目标分布和所述相似度迭代所述聚类中心,得到kl散度损失;
24、通过随机梯度下降方法更新所述聚类中心和所述自编码器的模型参数;
25、利用所述kl散度损失和所述模型参数更新所述自编码的参数梯度。
26、为实现上述目的,本发明实施例还提供了一种用户分类模型训练装置,包括:
27、数据处理模块,用于构建数据域中用户的人际关系矩阵和特征相似度矩阵;将所述人际关系矩阵和所述特征相似度矩阵进行拼接,得到用户信息矩阵;
28、模型训练模块,用于基于所述用户信息矩阵训练自编码器;
29、模型优化模块,用于对所述自编码器进行模型参数优化,得到用户分类模型。
30、为实现上述目的,本发明实施例还提供了一种用户分类模型训练设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一实施例所述的用户分类模型训练方法。
31、为实现上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述任一实施例所述的用户分类模型训练方法。
32、为实现上述目的,本发明实施例还提供了一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现如上述任一实施例所述的用户分类模型训练方法。
33、相比于现有技术,本发明公开的用户分类模型训练方法、装置、设备、存储介质和产品,在训练用户分类模型之前先对用户人际关系和用户特征关键词进行融合再进行特征分类模型训练,提高模型计算效率,降低复杂度,同时能更细粒度的筛选特征。另外,还能使得最终的分类结果由用户特征关键词和用户人际关系网共同决定,分类结果更加精准。
1.一种用户分类模型训练方法,其特征在于,包括:
2.如权利要求1所述的用户分类模型训练方法,其特征在于,所述构建数据域中用户的人际关系矩阵,包括:
3.如权利要求1所述的用户分类模型训练方法,其特征在于,所述构建数据域中用户的特征相似度矩阵,包括:
4.如权利要求1所述的用户分类模型训练方法,其特征在于,所述基于所述用户信息矩阵训练自编码器,包括:
5.如权利要求4所述的用户分类模型训练方法,其特征在于,在基于所述用户信息矩阵训练自编码器后,所述方法还包括:
6.如权利要求1所述的用户分类模型训练方法,其特征在于,所述对所述自编码器进行模型参数优化,
7.一种用户分类模型训练装置,其特征在于,包括:
8.一种用户分类模型训练设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6中任意一项所述的用户分类模型训练方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至6中任意一项所述的用户分类模型训练方法。
10.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令被处理器执行时实现如权利要求1至6中任一项所述的用户分类模型训练方法。
