本发明涉及个性化推荐,特别是涉及一种试题推荐模型的训练方法、试题推荐方法及系统。
背景技术:
1、传统教学模式采用无差别授课和盲目题海训练,增加了学习者的负担。随着智慧教育和智能辅助教学的兴起,国内外出现了众多在线教育平台,这些平台受到了高度重视。因此,如何精准推荐适合学习者的试题成为了一个热点问题。
2、然而,现有研究仅假设所有学习者和试题具有静态不变的特征,采用固定的模式(如隐向量)来建模,未能充分关注学习者和试题随时间变化的动态特征。许多推荐算法由于数据稀疏性和冷启动问题,过于依赖答题历史,对学习者及其相邻学习者(邻居)与试题之间的多种交互关系及其协同信息的传播和作用理解不足,表征困难。
3、因此,急需解决如何降低模型的数据稀疏性和答题历史依赖性,以提高个性化推荐的准确性和全面性。
技术实现思路
1、本发明的目的在于提供一种试题推荐模型的训练方法、试题推荐方法及系统,以便提高个性化推荐的准确性和全面性。
2、为了实现上述目的,第一方面,本发明提供了一种试题推荐模型的训练方法,所述训练方法包括:
3、获取多关系交互图;所述多关系交互图是以试题和学习者为节点,以学习者做不好试题交互矩阵和学习者全做对试题交互矩阵为边构建得到的;所述学习者做不好试题交互矩阵表征学习者做错试题对应的至少一个知识点,所述学习者全做对试题交互矩阵表征学习者做对试题对应的所有知识点;
4、利用预设的多关系图卷积对所述多关系交互图中的每个所述节点进行增强,得到所述节点对应的增强嵌入表征;其中,所述增强嵌入表征包括学习者增强嵌入表征和试题增强嵌入表征;
5、根据所述学习者增强嵌入表征和所述试题增强嵌入表征构建不同的样本对交互关系表征,通过所述样本对交互关系表征进行对比学习不同学习者之间的偏好,构建学习者对比损失函数;
6、根据所述学习者增强嵌入表征,通过对比学习试题的标签信息和做不好试题的学习者得到文本标签表征和试题表征,并根据所述文本标签表征和所述试题表征构建试题对比损失函数;
7、根据所述学习者增强嵌入表征和所述试题增强嵌入表征,构建学习者全做对试题损失函数和学习者做不好试题损失函数;
8、根据所述学习者对比损失函数、所述试题对比损失函数、所述学习者全做对试题损失函数和所述学习者做不好试题损失函数进行模型训练,得到目标推荐模型。
9、在一实施例中,在所述利用预设的多关系图卷积对所述多关系交互图中的每个所述节点进行增强,得到所述节点对应的增强嵌入表征之前,所述训练方法还包括:
10、基于所述学习者做不好试题交互矩阵和所述学习者全做对试题交互矩阵构建多关系邻接矩阵;
11、基于所述多关系邻接矩阵,利用预设的多关系图卷积对所述多关系交互图中的每个所述节点进行增强,得到所述节点对应的增强嵌入表征。
12、在一实施例中,所述基于所述学习者做不好试题交互矩阵和所述学习者全做对试题交互矩阵构建多关系邻接矩阵,包括:
13、根据所述学习者做不好试题交互矩阵和所述学习者全做对试题交互矩阵,构建稀疏交互矩阵;
14、对所述稀疏交互矩阵进行转换,得到所述多关系邻接矩阵。
15、在一实施例中,所述基于所述多关系邻接矩阵,利用预设的多关系图卷积对所述多关系交互图中的每个所述节点进行增强,得到所述节点对应的增强嵌入表征,包括:
16、获取所述节点的输入向量;
17、根据所述输入向量,采用预设的非线性共嵌入函数提取所述节点的初始特征嵌入向量;
18、在所述多关系图卷积任一层的卷积层中,通过所述多关系邻接矩阵聚合任一节点在所述多关系交互图中的邻居节点的信息,得到所述任一节点的更新嵌入向量;
19、遍历每层所述卷积层,针对每个所述节点,确定所有所述卷积层中所述节点对应的所述更新嵌入向量的平均值,得到所述节点对应的所述增强嵌入表征。
20、在一实施例中,所述根据所述学习者增强嵌入表征和所述试题增强嵌入表征构建不同的样本对交互关系表征,通过所述样本对交互关系表征进行对比学习不同学习者之间的偏好,构建学习者对比损失函数,包括:
21、通过mlp层对所述学习者增强嵌入表征和所述试题增强嵌入表征进行学习,生成不同的所述样本对交互关系表征;其中,所述样本对交互关系表征包括正样本对交互关系表征、细粒度负样本对交互关系表征和粗粒度负样本对交互关系表征;所述正样本对交互关系表征用于表征同一学习者在同一试题上的作答情况包括做不好试题和全做对试题的交互行为;所述细粒度负样本对交互关系表征用于表征不同学习者在同一试题上的作答情况包括做不好试题的交互行为;所述粗粒度负样本对交互关系表征用于表征不同学习者分别在不同试题上的作答情况包括做不好试题的交互行为;
22、根据所述正样本对交互关系表征和所述细粒度负样本对交互关系表征之间的相似性,构建细粒度损失函数;
23、根据所述正样本对交互关系表征和所述粗粒度负样本对关系表征之间的相似性,构建粗粒度损失函数;
24、对所述细粒度损失函数和所述粗粒度损失函数进行加权,得到所述学习者对比损失函数。
25、在一实施例中,所述根据所述学习者增强嵌入表征,通过对比学习试题的标签信息和做不好试题的学习者得到文本标签表征和试题表征,并根据所述文本标签表征和所述试题表征构建试题对比损失函数,包括:
26、通过文本编码器提取所述试题的标签信息,得到文本标签表征;
27、根据预设的选取规则对所述学习者增强嵌入表征进行选取,得到做不好试题的学习者嵌入表征;
28、通过试题编码器将所述做不好试题的学习者嵌入表征转化为试题表征;
29、根据所述文本标签表征和所述试题表征之间的相似性,构建文本标签损失函数和试题损失函数;
30、对所述文本标签损失函数和所述试题损失函数求平均,得到所述试题对比损失函数。
31、在一实施例中,所述根据所述学习者增强嵌入表征和所述试题增强嵌入表征,构建学习者全做对试题损失函数和学习者做不好试题损失函数,包括:
32、根据所述学习者增强嵌入表征和所述试题增强嵌入表征,通过全连接神经网络确定学习者做不好试题得分函数和学习者全做对试题得分函数;
33、使用二元交叉熵损失函数对所述学习者做不好试题得分函数和所述学习者全做对试题得分函数分别构建初始学习者做不好试题损失函数和初始学习者全做对试题损失函数;
34、使用均方误差对预设的相对难度系数进行优化,得到学习者做不好试题的相对难度系数损失函数和学习者全做对试题的相对难度系数损失函数;其中,所述相对难度系数表征学习者对试题中的知识点掌握程度;
35、根据所述初始学习者全做对试题损失函数和所述学习者全做对试题的相对难度系数损失函数的求和,得到所述学习者全做对试题损失函数;根据所述初始学习者做不好试题损失函数和所述学习者做不好试题的相对难度系数损失函数的求和,得到所述学习者做不好试题损失函数。
36、第二方面,本发明实施例提供了一种试题推荐方法,所述推荐方法包括:
37、获取目标多关系交互图;其中,所述目标多关系交互图是以目标试题和待推荐学习者为节点,以待推荐学习者做不好目标试题交互矩阵和待推荐学习者全做对目标试题交互矩阵为边构建得到;
38、将所述目标多关系交互图输入至上述所述的试题推荐模型的训练方法得到的目标推荐模型进行预测,得到所述目标试题对应的目标推荐学习者列表;
39、将所述目标试题推荐给所述目标推荐学习者列表中的学习者。
40、第三方面,本发明实施例提供了一种试题推荐模型的训练系统,所述训练系统包括:
41、交互图获取模块,用于获取多关系交互图;所述多关系交互图是以试题和学习者为节点,以学习者做不好试题交互矩阵和学习者全做对试题交互矩阵为边构建得到的;所述学习者做不好试题交互矩阵表征学习者做错试题对应的至少一个知识点,所述学习者全做对试题交互矩阵表征学习者做对试题对应的所有知识点;
42、节点增强模块,用于利用预设的多关系图卷积对所述多关系交互图中的每个所述节点进行增强,得到所述节点对应的增强嵌入表征;其中,所述增强嵌入表征包括学习者增强嵌入表征和试题增强嵌入表征;
43、学习者对比模块,用于根据所述学习者增强嵌入表征和所述试题增强嵌入表征构建不同的样本对交互关系表征,通过所述样本对交互关系表征进行对比学习不同学习者之间的偏好,构建学习者对比损失函数;
44、试题对比模块,用于根据所述学习者增强嵌入表征,通过对比学习试题的标签信息和做不好试题的学习者得到文本标签表征和试题表征,并根据所述文本标签表征和所述试题表征构建试题对比损失函数;
45、损失函数构建模块,用于根据所述学习者增强嵌入表征和所述试题增强嵌入表征,构建学习者全做对试题损失函数和学习者做不好试题损失函数;
46、模型训练模块,用于根据所述学习者对比损失函数、所述试题对比损失函数、所述学习者全做对试题损失函数和所述学习者做不好试题损失函数进行模型训练,得到目标推荐模型。
47、第四方面,本发明实施例提供了一种电子设备,包括
48、存储器,
49、处理器,以及
50、存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述的试题推荐模型的训练方法或上述所述的试题推荐方法。
51、第五方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现上述所述的试题推荐模型的训练方法或上述所述的试题推荐方法。
52、本发明实施例一种试题推荐模型的训练方法、试题推荐方法及系统与现有技术相比,其有益效果在于:
53、本发明利用预设的多关系图卷积对获取的多关系交互图中的每个节点进行增强,以捕获学习者及其邻居与试题之间的协同信息,从而增强学习者与试题的嵌入。通过构建学习者对比学习和试题对比学习两种角度的损失函数,辅助优化试题和学习者的特征表示,增加了不同学习者在选答试题偏好的差异,缩小了同一学习者与试题间的不同交互偏好,并对试题与标签的对标和互释进行了优化,从而根本增强了个性化试题推荐的能力和准确性。此外,结合学习者全做对试题损失函数和学习者做不好试题损失函数进行模型训练,全面降低了数据稀疏性和答题历史依赖性,显著提升了个性化试题推荐的整体性能。
1.一种试题推荐模型的训练方法,其特征在于,所述训练方法包括:
2.根据权利要求1所述的训练方法,其特征在于,在所述利用预设的多关系图卷积对所述多关系交互图中的每个所述节点进行增强,得到所述节点对应的增强嵌入表征之前,所述训练方法还包括:
3.根据权利要求2所述的训练方法,其特征在于,所述基于所述学习者做不好试题交互矩阵和所述学习者全做对试题交互矩阵构建多关系邻接矩阵,包括:
4.根据权利要求2所述的训练方法,其特征在于,所述基于所述多关系邻接矩阵,利用预设的多关系图卷积对所述多关系交互图中的每个所述节点进行增强,得到所述节点对应的增强嵌入表征,包括:
5.根据权利要求1所述的训练方法,其特征在于,所述根据所述学习者增强嵌入表征和所述试题增强嵌入表征构建不同的样本对交互关系表征,通过所述样本对交互关系表征进行对比学习不同学习者之间的偏好,构建学习者对比损失函数,包括:
6.根据权利要求1所述的训练方法,其特征在于,所述根据所述学习者增强嵌入表征,通过对比学习试题的标签信息和做不好试题的学习者得到文本标签表征和试题表征,并根据所述文本标签表征和所述试题表征构建试题对比损失函数,包括:
7.根据权利要求1所述的训练方法,其特征在于,所述根据所述学习者增强嵌入表征和所述试题增强嵌入表征,构建学习者全做对试题损失函数和学习者做不好试题损失函数,包括:
8.一种试题推荐方法,其特征在于,所述推荐方法包括:
9.一种试题推荐模型的训练系统,其特征在于,所述训练系统包括:
10.一种电子设备,其特征在于,包括
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的试题推荐模型的训练方法或如权利要求8所述的试题推荐方法。