本发明涉及个性化推荐,具体涉及基于知识图谱和注意力机制的个性化文章推荐方法。
背景技术:
1、随着教育资源的迅猛增长,教育内容的复杂性与多样性给推荐系统带来了巨大挑战。教育数据的爆发式增长为精准教学和个性化学习提供了可能,但同时也带来了知识迷航和认知过载的挑战。推荐系统能挖掘在线学习者潜在的兴趣偏好帮助在线学习平台定位特定的潜在学习者,并制定个性化的推荐,向学习者提供个性化的学习资源,但是传统的数据挖掘方法往往难以捕捉教育数据中的深层关系和复杂模式,无法为每个学生提供精准的文章推荐。
2、目前数据稀疏性是制约个性化学习领域的主要因素,尤其是在教育场景中,用户交互频率相较于传统购物场景明显偏低,这导致向学习者提供精确推荐带来了重大挑战。尽管知识图谱有助于缓解数据稀疏性问题,但教育领域的知识体系庞大且复杂,需要广泛收集和处理大量教育资源。此外,如何有效利用知识图谱进行学生数据分析,也是当前面临的一大挑战。
技术实现思路
1、为了解决上述技术问题,本发明的目的在于提供一种基于知识图谱和注意力机制的个性化文章推荐方法,所采用的技术方案具体如下:
2、本发明提供了一种基于知识图谱和注意力机制的个性化文章推荐方法,该方法包括以下步骤:
3、获取学堂在线教育数据集,基于学堂在线教育数据集中实体之间的关联关系构建知识图谱;
4、将知识图谱中实体间的三元组信息输入到transe模型中进行训练,获取不同实体的嵌入向量;
5、将嵌入向量通过节点级别的注意力机制学习不同节点聚合其邻居后的特征表示,通过语义级别的注意力机制学习节点与其他节点关联时在不同元路径上的特征表示信息,获得最终的嵌入向量;
6、对所述最终的嵌入向量进行扩展矩阵分解,采用贝叶斯个性化排序算法得到用户与文章交互的得分,基于所述得分获得推荐列表。
7、优选的,所述基于学堂在线教育数据集中实体之间的关联关系构建知识图谱,包括:
8、获取学堂在线教育数据集中学习计算机科学课程的用户信息,并删除学习课程数量小于预设数量的用户;
9、从筛选的数据集中提取用户信息、课程信息、文章信息和知识概念信息,分别构建用户信息的索引、课程信息的索引、文章信息的索引和知识概念信息的索引;
10、将用户信息和用户id的索引写入user.txt文本文件中,将课程信息的索引和课程id写入course.txt中,将文章信息的索引和文章id写入paper.txt中,将知识概念信息的索引和知识概念id写入concept.txt中;
11、通过从筛选的数据集中提取实体、关系和属性的信息,生成节点和节点之间的联系,将用户-用户信息、课程-课程信息、用户-课程信息、课程-文章信息,以索引的形式建立对应的关系信息,保存到对应的索引文件中;
12、建立一个空图,将用户索引、课程索引、概念索引、文章索引分别添加到图中作为图中的节点,根据关联关系建立将图中对应节点相连构建知识图谱。
13、优选的,所述将知识图谱中实体间的三元组信息输入到transe模型中进行训练,获取不同实体的嵌入向量,包括:
14、利用transe模型将知识图谱中的三元组转化为相应的嵌入向量表示,所述三元组由头实体、关系和尾实体构成;
15、通过构建头实体和尾实体向量之间的关系学习实体和关系的嵌入;
16、在transe模型的学习过程中,采用随机梯度下降方法进行训练,并计算向量间的距离;
17、在训练过程中,transe模型学习实体与关系之间的潜在路径信息;利用hinge损失函数优化向量表示,通过梯度下降法更新模型参数,获得不同实体的嵌入向量。
18、优选的,所述hinge损失函数为:
19、
20、其中,表示hinge损失函数,d表示正样本集合,d'表示负样本集合,d()表示距离函数,h表示正样本集合中的头实体,t表示正样本集合中的尾实体,r表示头实体和尾实体之间的关系,γ为超参数,h′表示负样本集合中的头实体,t′表示负样本集合中的尾实体,,max()表示取最大值函数。
21、优选的,所述将嵌入向量通过节点级别的注意力机制学习不同节点聚合其邻居后的特征表示,通过语义级别的注意力机制学习节点与其他节点关联时在不同元路径上的特征表示信息,获得最终的嵌入向量,包括:
22、对于每一种类型的节点,构建节点类型转换矩阵;将不同类型节点的特征映射到相同的特征空间中,利用注意力机制学习不同类型节点的权重,获得学习后节点的实体嵌入向量;
23、对于节点i,学习后节点i的实体嵌入向量为:
24、
25、其中,h′i表示学习后节点i的实体嵌入向量,表示节点i对应的类型转换矩阵,hi表示学习前节点i的实体嵌入向量;
26、节点i通过节点级注意力学习其通过元路径所邻接的邻居节点的注意力分数:
27、
28、其中,表示节点i通过节点级注意力学习其通过元路径所邻接的邻居节点j的注意力分数,φ为节点之间的元路径集合,attnode表示嵌入之间的相似性,hj′表示学习后节点i的邻居节点j的实体嵌入向量;
29、对邻居节点的注意力分数进行归一化,获得每个邻居节点的注意力权重;
30、根据学习后节点i的所有邻居节点的实体嵌入向量和所述注意力权重,获得节点i基于每条元路径的特征;
31、将每个节点基于每条元路径下的嵌入经过一个非线性转换层,并融合语义层注意力向量,获得每条元路径的权重;
32、将元路径的权重与节点级嵌入向量进行加权求和,得到最终的嵌入向量。
33、优选的,所述将每个节点基于每条元路径下的嵌入经过一个非线性转换层,并融合语义层注意力向量,获得每条元路径的权重,包括:
34、采用如下公式计算每条元路径的初始权值:
35、
36、其中,表示元路径p的初始权重,v表示节点集合,qt表示语义层注意力向量的转置,tanh表示激活函数,w表示权重矩阵,表示节点i在元路径p的特征,b表示偏移向量;
37、对每条元路径的初始权值进行归一化处理获得每条元路径的权重。
38、优选的,推荐列表的获取,包括:
39、基于用户对应的低维向量和文章对应的低维向量,确定用户对文章的偏好分数;
40、通过隐特征向量计算未交互文章的预测偏好分数;基于所述预测偏好分数采用贝叶斯个性化排序算法构建推荐列表。
41、优选的,采用扩展矩阵分解方法对所述最终的嵌入向量进行扩展矩阵分解。
42、本发明至少具有如下有益效果:
43、本发明采用深度学习技术,通过在推荐模型中融合知识图谱的路径信息,增强了用户信息的表示,采用知识图谱的方法,使得系统能够更全面的提取用户的关键信息,减轻推荐中的数据稀疏的问题,提高了推荐结果的准确性。
1.一种基于知识图谱和注意力机制的个性化文章推荐方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于知识图谱和注意力机制的个性化文章推荐方法,其特征在于,所述基于学堂在线教育数据集中实体之间的关联关系构建知识图谱,包括:
3.根据权利要求1所述的基于知识图谱和注意力机制的个性化文章推荐方法,其特征在于,所述将知识图谱中实体间的三元组信息输入到transe模型中进行训练,获取不同实体的嵌入向量,包括:
4.根据权利要求3所述的基于知识图谱和注意力机制的个性化文章推荐方法,其特征在于,所述hinge损失函数为:
5.根据权利要求1所述的基于知识图谱和注意力机制的个性化文章推荐方法,其特征在于,所述将嵌入向量通过节点级别的注意力机制学习不同节点聚合其邻居后的特征表示,通过语义级别的注意力机制学习节点与其他节点关联时在不同元路径上的特征表示信息,获得最终的嵌入向量,包括:
6.根据权利要求5所述的基于知识图谱和注意力机制的个性化文章推荐方法,其特征在于,所述将每个节点基于每条元路径下的嵌入经过一个非线性转换层,并融合语义层注意力向量,获得每条元路径的权重,包括:
7.根据权利要求1所述的基于知识图谱和注意力机制的个性化文章推荐方法,其特征在于,推荐列表的获取,包括:
8.根据权利要求1所述的基于知识图谱和注意力机制的个性化文章推荐方法,其特征在于,采用扩展矩阵分解方法对所述最终的嵌入向量进行扩展矩阵分解。