本发明提供一种融合用户属性和时间效应的协同过滤推荐工作方法,属于推荐系统领域。
背景技术:
1、随着互联网和信息技术的快速发展,推荐系统在电子商务、社交网络、视频平台等各类应用中发挥着越来越重要的作用。基于皮尔斯相似度的协同过滤推荐方法是一种经典的传统的推荐方法,它是利用皮尔斯相关系数计算用户之间的相似度,寻找与目标用户相似度高的用户集合,然后根据他们的历史行为预测目标用户可能的行为,它在一定程度上能够提高推荐的准确性和用户满意度。然而,这种传统的推荐方法没有考虑用户的静态属性信息,如年龄、职业,而且在处理动态用户行为和时间效应方面存在一定的局限性。
2、众所周知,不同年龄、不同职业的用户对于观看电影、视频以及参与社交网络的喜好程度略有不同,在基于皮尔斯相似度的协同过滤推荐方法中引入年龄、职业这些用户的静态属性信息,可以更好地理解和预测用户的兴趣和偏好。通过对不同用户群体进行个性化建模,提升推荐的个性化程度,从而提高推荐的准确性。
3、再者,用户的兴趣和偏好并不是静态不变的,而是会随着时间推移、生活环境变化和个人经历的增加而不断变化。传统的基于皮尔斯相似度的协同过滤推荐方法往往忽略了用户兴趣的时效性,只关注历史数据,导致推荐结果可能与用户当前的需求不匹配。此外,不同用户在不同时间段对相同项目的关注度也会有显著差异,例如,季节性商品、节假日特定商品等。因此,将时间效应纳入到基于皮尔斯相似度的协同过滤推荐方法中,利用时间戳时间特征,捕捉用户兴趣的动态变化。通过时间效应建模,可以提升推荐结果的时效性和相关性,从而进一步提高推荐的准确性。
4、为了更准确地捕捉用户的兴趣变化和时间效应,提升推荐结果的时效性和个性化程度,实现进一步提高推荐的准确性,亟需一种融合用户属性和时间效应的协同过滤推荐工作方法。
技术实现思路
1、针对现有技术的不足,本发明提供一种融合用户属性和时间效应的协同过滤推荐工作方法,准确地捕捉用户的兴趣变化和时间效应,提升推荐系统对用户兴趣变化的敏感度,增强推荐结果的时效性和个性化,达到进一步提高推荐准确性的目的,适用于电子商务、社交网络、视频平台等各类应用场景,具有广泛的应用前景和市场价值。
2、本发明的技术方案为:
3、一种融合用户属性和时间效应的协同过滤推荐工作方法,包括如下步骤:
4、(1)根据数据集建立用户评分矩阵mscore和用户评分时间矩阵mtime,同时获取用户属性;
5、(2)利用用户评分时间矩阵和时间衰减公式获得融合时间效应的皮尔斯相似度,然后结合jaccard相似度得到融合时间和共同评分权重系数的皮尔斯相似度,同时,根据用户属性并结合皮尔斯相似度得到融合用户属性的皮尔斯相似度;
6、(3)将融合时间和共同评分权重系数的皮尔斯相似度与融合用户属性的皮尔斯相似度进行加权,得到最终的相似度计算公式;
7、(4)根据步骤(3)得到的最终的相似度获取每个用户最相似的k位邻居;
8、(5)根据最近邻居集合的评分对每位目标用户未评分的项目进行预测评分。
9、优选的,步骤(1)中,首先对数据集进行划分,按比例分为训练集和测试集,然后对训练集进行预处理,得到用户属性。
10、由用户项目矩阵mscore可以计算用户之间的相似度,用户评分矩阵mscore的每个矩阵元素表示不同用户对不同项目的具体评分,rui是用户u对项目i的评分,rvi是用户v对项目i的评分,传统的皮尔斯相似度公式如式(1)所示,
11、
12、其中,simpearson(u,v)是用户u和用户v之间的皮尔斯相似度,iu是用户u评价的项目集合,iv是用户v评价的项目集合,是用户u的评分平均值,是用户v的评分平均值。
13、优选的,步骤(2)中,用户评分时间矩阵mtime经过时间衰减公式进行概率归一化,得到时间衰减概率矩阵mp-time,mtime矩阵中每个元素代入到公式(3)的用户评分时间戳值t可得到mp-time,带入其转换过程可由式(2)表示:
14、
15、时间衰减公式f(t)如下式(3)所示:
16、
17、其中,tmax为评分时间戳中最大值,tmin为评分时间戳中最小值,t为评分时间戳值;
18、评分时间戳值t越近,用户兴趣衰减越小,转化为的概率就越接近1;反之,用户评分时间间隔越久,用户兴趣衰减会加大;
19、在皮尔斯相似度公式中融合时间衰减概率矩阵mp-time,融合时间效应的皮尔斯相似度simtime(u,v)如式(4)所示:
20、
21、其中,时间衰减概率矩阵mp-time的每个矩阵元素表示不同用户对不同项目的评分时间衰减概率,rp-ui是用户u对项目i的评分时间衰减概率,rp-vi用户v对项目i的评分时间衰减概率,用户评分矩阵的每个矩阵元素表示不同用户对不同项目的具体评分,rui是用户u对项目i的评分,rvi是用户v对项目i的评分,是用户u的评分平均值,是用户v的评分平均值,iu是用户u评价的项目集合,iv是用户v评价的项目集合。
22、优选的,步骤(2)中,由于皮尔斯相似度计算公式会依赖于用户共同评分,而jaccard相似度考虑了用户的非共同评分,因此将皮尔斯相似度与jaccard相似度进行结合,把jaccard相似度作为共同评分的权重系数,来解决皮尔斯相似度计算公式依赖用户共同评分的问题,jaccard相似度如式(5)所示:
23、
24、其中,|·|是集合数目;
25、将融合时间效应的皮尔斯相似度与jaccard相似度相乘,然后得到融合时间和共同评分权重系数的皮尔斯相似度公式,如式(6)所示:
26、simt-jaccard(u,v)=simtime(u,v)×simjaccard(u,v) (6)
27、由于皮尔斯相似度会依赖于用户共同评分,而jaccard相似度作为共同评分权重系数可以将其与皮尔斯相似度相乘,得到式(6),这样它在皮尔斯相似度的基础上考虑了用户的非共同评分,融合了更多的有效信息,能一定程度上提高推荐准确度。
28、优选的,同时,本发明在皮尔斯相似度基础上融合用户属性,考虑将年龄和职业作为用户属性,由用户属性可以计算用户之间的用户属性相似度;
29、根据用户的年龄属性,得到年龄属性相似度公式,如式(7)所示:
30、
31、其中,ageu和agev分别为用户u和用户v的年龄;年龄相差越大相似度越小,反之,年龄相差越小相似度则越大,公式(7)通过指数函数计算年龄之间的相似度,符合这个规律,具有一定的合理性;
32、根据用户的职业属性将数据集各种职业建立职业类别树,得到职业属性相似度公式,如式(8)所示:
33、
34、其中,tuv为用户u和用户v之间的距离,high为职业类别树的深度;职业越类似,相似度越大,反之,则相似度越小;
35、结合年龄属性、职业属性的相似度和皮尔斯相似度公式,可得到在皮尔斯相似度基础上融合用户属性的相似度公式,如式(9)所示:
36、simuser(u,v)=α×simpearson(u,v)+(1-α)[η×simage(u,v)+(1-η)×simocc(u,v)](9)
37、其中,η是年龄属性占用户属性的比重系数,α是传统皮尔斯相似度占融合用户属性的皮尔斯相似度的比重系数。
38、优选的,步骤(3)中,将融合时间效应和共同评分权重系数的皮尔斯相似度和融合用户属性的皮尔斯相似度加权相结合,得到最终的相似度计算公式,如式(10)所示:
39、simtotal(u,v)=μ×simt-jaccard(u,v)+(1-μ)×simuser(u,v) (10)
40、其中,μ是融合时间效应和共同评分权重系数的皮尔斯相似度的比重系数。
41、优选的,步骤(4)和(5)中,采用如下公式进行预测评分:
42、
43、其中,为用户u对项目i的预测评分,nk(u)表示用户u的k位邻居用户集合。公式(11)考虑了用户对项目的偏好程度,即相似用户的评分会根据他们与目标用户的相似度进行加权调整,以考虑目标用户与相似用户之间的偏好差异。
44、优选的,将预测的结果与测试集中的结果进行比对,并通过mae和rmse指标进行衡量,公式如式(12)和式(13)所示,其中,n为用户u评价的项目数量,{pu1,pu2……,pun}是用户u根据相似度对项目{1,2……,n}的计算评分,{qu1,qu2……,qun}表示的是用户u对项目{1,2……,n}的真实评分。
45、
46、本发明未详尽之处,均可参见现有技术。
47、本发明的有益效果为:
48、本发明通过在皮尔斯用户相似度的基础上融合时间效应和共同评分权重系数,更好地解决用户的兴趣和偏好的变化与偏移;同时,融合了用户的年龄和职业静态属性,针对用户个人能够进行更好地个性化推荐。本发明在皮尔斯相似度基础上融合了用户属性和时间效应,不仅提升了推荐系统对用户兴趣变化的敏感度,还增强了推荐结果的时效性和个性化,从而进一步提高推荐的准确性,适用于电子商务、社交网络、视频平台等各类应用场景,具有广泛的应用前景和市场价值。
1.一种融合用户属性和时间效应的协同过滤推荐工作方法,其特征在于,包括如下步骤;
2.根据权利要求1所述融合用户属性和时间效应的协同过滤推荐工作方法,其特征在于,步骤(1)中,首先对数据集进行划分,按比例分为训练集和测试集,然后对训练集进行预处理,得到用户属性。
3.根据权利要求1所述融合用户属性和时间效应的协同过滤推荐工作方法,其特征在于,步骤(2)中,用户评分时间矩阵mtime经过时间衰减公式进行概率归一化,得到时间衰减概率矩阵mp-time,时间衰减公式f(t)如下式(3)所示:
4.根据权利要求3所述融合用户属性和时间效应的协同过滤推荐工作方法,其特征在于,步骤(2)中,jaccard相似度如式(5)所示:
5.根据权利要求4所述融合用户属性和时间效应的协同过滤推荐工作方法,其特征在于,步骤(2)中,根据用户的年龄属性,得到年龄属性相似度公式,如式(7)所示:
6.根据权利要求5所述融合用户属性和时间效应的协同过滤推荐工作方法,其特征在于,步骤(3)中,将融合时间效应和共同评分权重系数的皮尔斯相似度和融合用户属性的皮尔斯相似度加权相结合,得到最终的相似度计算公式,如式(10)所示:
7.根据权利要求6所述融合用户属性和时间效应的协同过滤推荐工作方法,其特征在于,步骤(4)和(5)中,采用如下公式(11)进行预测评分: