一种数字教育资源推荐方法和系统与流程

    技术2025-07-18  3


    本发明涉及数据挖掘,具体是一种数字教育资源推荐方法和系统。


    背景技术:

    1、数字教育资源因为主要是视频、音频或者文档,单个用户在多个平台的浏览、收藏、点击、购买或学习行为进行特征提取和数字教育资源的特征匹配是能够实现的,但是跨平台的分享较难。多个数字教育资源平台由于版权的原因,并不能相互分享各自的资源。导致单个用户虽然在某个平台积累了用户行为,但是用户访问另一个平台却无法精准进行匹配;其次,基于数字教育资源的特征提取是比常规的行为特征提取更难,因为其对象是视频、音频或者文档,其比单一的产品而言还具有学习匹配属性。举例而言,当用户在进行数字教育资源比如高等数学的学习中,结果发现用户学习效果明显低于同类学习人员,平台就会推荐和该高等数学课程相关的基础知识;当所需的高等数学课程相关的基础知识在当前数字教育资源平台不存在时,当前数字教育资源平台难以将当前需求安全地发送到其他数字教育资源平台。


    技术实现思路

    1、(1)要解决的技术问题

    2、本发明的目的在于提供一种数字教育资源推荐方法和系统,以解决数字教育资源跨平台安全进行分享的问题。

    3、(2)技术方案

    4、为实现上述目的,一方面,本发明提供了一种数字教育资源推荐方法,所述方法包括:

    5、遍历数字资源平台的数字教育资源,所述数字教育资源为视频、音频、图像、文本或网页至少之一;将数字教育资源转化成可读内容并提取资源属性特征;

    6、获取用户在数字教育资源平台的行为数据,所述行为数据包括用户对数字教育资源的点击行为、收藏行为、购买行为和学习行为;通过用户的行为数据及对应的数字教育资源的资源属性特征得到用户反馈特征,所述用户反馈特征包括用于反映用户对数字教育资源兴趣程度的用户属性特征以用于反映用户对数字教育资源兴趣程度变化趋势的用户趋势特征;将用户属性特征和用户趋势特征压缩得到低维潜在因子;

    7、将低维潜在因子提取多个粒度级别的特征向量;将各个粒度级别的特征向量通过局部敏感哈希函数将用户隐私嵌入向量映射为对应级别的语义相关的二进制哈希码,将二进制哈希码记为用户隐私画像码并通过跨平台进行数字教育资源匹配推荐。

    8、进一步地,所述通过用户的行为数据及对应的数字教育资源的资源属性特征得到用户反馈特征,所述用户反馈特征包括用于反映用户对数字教育资源兴趣程度的用户属性特征以用于反映用户对数字教育资源兴趣程度变化趋势的用户趋势特征;将用户属性特征和用户趋势特征压缩得到低维潜在因子的方法包括:

    9、将用户x针对数字教育资源r的行为数据x(r)构建为[x(r),y(r),z(r),v(r)],其中x(r)代表用户x针对数字教育资源r的点击行为,y(r)代表用户x针对数字教育资源r的收藏行为,z(r)代表用户x针对数字教育资源r的购买行为,v(r)代表用户x针对数字教育资源r的学习行为;设数字教育资源r的资源属性特征为d(r)=[d1,d2],其中d1代表数字教育资源r的可读内容长度、d2代表数字教育资源r的专业术语的数量;将行为数据x(r)和资源属性特征为d(r)分别归一化后得到和通过高斯核函数将和映射到高维特征空间h得到高维特征向量e(r)为:

    10、

    11、其中n为高斯核函数的数量且为高维特征空间h的维度,σn为预设的第n个高斯核函数的带宽参数;将用户x针对数字教育资源r的随机两次的行为数据分别对应的高维特征向量e(r1)和e(r2)计算核矩阵kr为:

    12、

    13、其中σ为预设的高斯核函数的全局带宽参数;通过核矩阵kr将高维特征向量嵌入到低维黎曼流形空间得到高维动态流形结构m;在高维动态流形结构m的稀疏表示矩阵s,第一目标公式为:

    14、

    15、其中高维动态流形结构m的原始流形特征ξ为用户x针对数字教育资源r的行为数据对应的高维特征向量e(r)组成的矩阵,|ξ-ξs|f是求(ξ-ξs)的f范数,|s|1是求稀疏表示矩阵s的l1范数,λ为预设的稀疏正则化参数;通过梯度下降法求得第一目标公式的最小值,根据第一目标公式的最小值求得稀疏表示矩阵s;将稀疏表示矩阵s重构高维动态流形结构中的原始流形特征ξ得到稀疏流形特征矩阵ξ',其中ξ'=ξs;将稀疏流形特征矩阵ξ'中的非零元素作为用户x针对数字教育资源r的用户属性特征,提取稀疏流形特征矩阵ξ'中的非零元素随时间变化的数据得到的时间序列数据作为用户x针对数字教育资源r的用户趋势特征;通过拉普拉斯特征映射将高维动态流形结构中的用户属性特征和用户趋势特征压缩到低维空间,拉普拉斯特征映射过程的第二目标公式ψ2为:

    16、

    17、其中,n为用户x针对数字教育资源r的行为数据的数量,i和j为行为数据的集合的抽样序号且取值为0到n的整数变量,f(ri)和f(rj)为用户x针对数字教育资源r的随机两次的行为数据分别对应的低维潜在因子,α为预设的缩放参数;求得第二目标公式ψ2的最小值,并将ψ2的最小值时的低维潜在因子[f(r1),f(r2),…,f(rn)]。

    18、进一步地,所述求得第二目标公式ψ2的最小值,并将ψ2的最小值时的低维潜在因子[f(r1),f(r2),…,f(rn)]的方法包括:

    19、设权重矩阵p1且权重矩阵的元素设对角矩阵p2且对角矩阵的元素拉普拉斯矩阵p3且p3=p2-p1;将权重矩阵p1、对角矩阵p2和拉普拉斯矩阵p3带入第三目标公式:

    20、lf=λ′df;

    21、其中λ'为目标特征值,f为目标特征向量,通过第三目标公式求得所有目标特征值及其对应的目标特征向量,将目标特征向量作为低维空间特征向量[f(r1),f(r1),…,f(rn)]。

    22、进一步地,所述将低维潜在因子提取多个粒度级别的特征向量的方法包括:

    23、根据预设的隐私级别始化粒度级别l,对每个粒度级别从用户x中抽样得到用户节点xm对应的低维潜在因子提取用户隐私嵌入向量的公式为:

    24、

    25、其中σm为第一激活函数,和分别为粒度级别l的权重矩阵和偏置向量;构建属性图其中x为用户集合,ψ为数字教育资源集合,m为取值从0到用户集合x的数量之间的整数变量,t为取值从0到数字教育资源集合ψ的数量之间的整数变量;用户节点xm∈x,数字教育资源节点用户节点xm和数字教育资源节点形成的边记为边节点w且边节点w组成边集φ即满足w∈φ;初始化用户节点xm在粒度级别为0时的特征向量为第(τ+1)粒度级别的特征向量计算公式为:

    26、

    27、其中στ为第二激活函数,τ取值为从0到粒度级别l的整数变量,x0为用户节点xm和数字教育资源节点的邻居节点集合,xω取值为邻居节点集合x0内的用户节点,δ0为用户节点xm和数字教育资源节点之间的注意力系数,wτ为第τ层的权重矩阵,为粒度级别为τ对应的用户节点xm和数字教育资源节点之间的特征向量。

    28、进一步地,所述将各个粒度级别的特征向量通过局部敏感哈希函数将用户隐私嵌入向量映射为对应级别的语义相关的二进制哈希码,将二进制哈希码记为用户隐私画像码并通过跨平台进行数字教育资源匹配推荐的方法包括:

    29、将各个粒度级别的特征向量通过级联哈希模块将其映射为对应级别的语义相关二进制哈希码

    30、

    31、其中hash是局部敏感哈希函数;将二进制哈希码记为用户隐私画像码,加密后的用户隐私画像码为:

    32、

    33、其中g和h为预先设定的公钥,r为随机数,mod为模运算;将用户隐私画像码通过跨平台进行数字教育资源匹配推荐。

    34、基于同一发明构思,另一方面,本发明还提供了一种数字教育资源推荐系统,所述系统包括:

    35、第一获取模块,用于遍历数字资源平台的数字教育资源,所述数字教育资源为视频、音频、图像、文本或网页至少之一;将数字教育资源转化成可读内容并提取资源属性特征;

    36、第二获取模块,用于获取用户在数字教育资源平台的行为数据,所述行为数据包括用户对数字教育资源的点击行为、收藏行为、购买行为和学习行为;通过用户的行为数据及对应的数字教育资源的资源属性特征得到用户反馈特征,所述用户反馈特征包括用于反映用户对数字教育资源兴趣程度的用户属性特征以用于反映用户对数字教育资源兴趣程度变化趋势的用户趋势特征;将用户属性特征和用户趋势特征压缩得到低维潜在因子;

    37、推荐模块,用于将低维潜在因子提取多个粒度级别的特征向量;将各个粒度级别的特征向量通过局部敏感哈希函数将用户隐私嵌入向量映射为对应级别的语义相关的二进制哈希码,将二进制哈希码记为用户隐私画像码并通过跨平台进行数字教育资源匹配推荐。

    38、进一步地,所述系统还包括:

    39、特征提取模块,用于将用户x针对数字教育资源r的行为数据x(r)构建为[x(r),y(r),z(r),v(r)],其中x(r)代表用户x针对数字教育资源r的点击行为,y(r)代表用户x针对数字教育资源r的收藏行为,z(r)代表用户x针对数字教育资源r的购买行为,v(r)代表用户x针对数字教育资源r的学习行为;设数字教育资源r的资源属性特征为d(r)=[d1,d2],其中d1代表数字教育资源r的可读内容长度、d2代表数字教育资源r的专业术语的数量;将行为数据x(r)和资源属性特征为d(x)分别归一化后得到和通过高斯核函数将和映射到高维特征空间h得到高维特征向量e(r)为:

    40、

    41、其中n为高斯核函数的数量且为高维特征空间h的维度,σn为预设的第n个高斯核函数的带宽参数;将用户x针对数字教育资源r的随机两次的行为数据分别对应的高维特征向量e(r1)和e(r2)计算核矩阵kr为:

    42、

    43、其中σ为预设的高斯核函数的全局带宽参数;通过核矩阵kr将高维特征向量嵌入到低维黎曼流形空间得到高维动态流形结构m;在高维动态流形结构m的稀疏表示矩阵s,第一目标公式为:

    44、

    45、其中高维动态流形结构m的原始流形特征ξ为用户x针对数字教育资源r的行为数据对应的高维特征向量e(r)组成的矩阵,|ξ-ξs|f是求(ξ-ξs)的f范数,|s|1是求稀疏表示矩阵s的l1范数,λ为预设的稀疏正则化参数;通过梯度下降法求得第一目标公式的最小值,根据第一目标公式的最小值求得稀疏表示矩阵s;将稀疏表示矩阵s重构高维动态流形结构中的原始流形特征ξ得到稀疏流形特征矩阵ξ',其中ξ'=ξs;将稀疏流形特征矩阵ξ'中的非零元素作为用户x针对数字教育资源r的用户属性特征,提取稀疏流形特征矩阵ξ'中的非零元素随时间变化的数据得到的时间序列数据作为用户x针对数字教育资源r的用户趋势特征;通过拉普拉斯特征映射将高维动态流形结构中的用户属性特征和用户趋势特征压缩到低维空间,拉普拉斯特征映射过程的第二目标公式ψ2为:

    46、

    47、其中,n为用户x针对数字教育资源r的行为数据的数量,i和j为行为数据的集合的抽样序号且取值为0到n的整数变量,f(ri)和f(rj)为用户x针对数字教育资源r的随机两次的行为数据分别对应的低维潜在因子,a为预设的缩放参数;求得第二目标公式ψ2的最小值,并将ψ2的最小值时的低维潜在因子[f(r1),f(r2),…,f(rn)]。

    48、进一步地,所述特征提取模块还包括:

    49、特征求解模块,用于设权重矩阵p1且权重矩阵的元素设对角矩阵p2且对角矩阵的元素拉普拉斯矩阵p3且p3=p2-p1;将权重矩阵p1、对角矩阵p2和拉普拉斯矩阵p3带入第三目标公式:

    50、lf=λ′df;

    51、其中λ'为目标特征值,f为目标特征向量,通过第三目标公式求得所有目标特征值及其对应的目标特征向量,将目标特征向量作为低维空间特征向量[f(r1),f(r1),…,f(rn)]。

    52、进一步地,所述系统还包括:

    53、分级隐私模块,用于根据预设的隐私级别始化粒度级别l,对每个粒度级别从用户x中抽样得到用户节点xm对应的低维潜在因子提取用户隐私嵌入向量的公式为:

    54、

    55、其中σm为第一激活函数,和分别为粒度级别l的权重矩阵和偏置向量;构建属性图其中x为用户集合,ψ为数字教育资源集合,m为取值从0到用户集合x的数量之间的整数变量,t为取值从0到数字教育资源集合ψ的数量之间的整数变量;用户节点xm∈x,数字教育资源节点用户节点xm和数字教育资源节点形成的边记为边节点w且边节点w组成边集φ即满足w∈φ;初始化用户节点xm在粒度级别为0时的特征向量为第(τ+1)粒度级别的特征向量计算公式为:

    56、

    57、其中στ为第二激活函数,τ取值为从0到粒度级别l的整数变量,x0为用户节点xm和数字教育资源节点的邻居节点集合,xω取值为邻居节点集合x0内的用户节点,δ0为用户节点xm和数字教育资源节点之间的注意力系数,wτ为第τ层的权重矩阵,为粒度级别为τ对应的用户节点xm和数字教育资源节点之间的特征向量。

    58、进一步地,所述系统还包括:

    59、加密分享模块,用于将各个粒度级别的特征向量通过级联哈希模块将其映射为对应级别的语义相关二进制哈希码

    60、

    61、其中hash是局部敏感哈希函数;将二进制哈希码记为用户隐私画像码,加密后的用户隐私画像码为:

    62、

    63、其中g和h为预先设定的公钥,r为随机数,mod为模运算;将用户隐私画像码通过跨平台进行数字教育资源匹配推荐。

    64、(3)有益效果

    65、与现有技术相比,本发明的有益效果是:

    66、1.通过多层次的数据处理和加密机制,有效地保护了用户的个人信息和学习行为数据,便于具有版权的数字教育资源能够跨平台进行推荐。

    67、2.通过将用户特征转化为高度概括的隐私保护码,能够在不直接访问用户原始数据的情况下,依然能够提供高质量的个性化推荐服务。


    技术特征:

    1.一种数字教育资源推荐方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的一种数字教育资源推荐方法,其特征在于,所述通过用户的行为数据及对应的数字教育资源的资源属性特征得到用户反馈特征,所述用户反馈特征包括用于反映用户对数字教育资源兴趣程度的用户属性特征以用于反映用户对数字教育资源兴趣程度变化趋势的用户趋势特征;将用户属性特征和用户趋势特征压缩得到低维潜在因子的方法包括:

    3.根据权利要求2所述的一种数字教育资源推荐方法,其特征在于,所述求得第二目标公式ψ2的最小值,并将ψ2的最小值时的低维潜在因子[f(r1),f(r2),…,f(rn)]的方法包括:

    4.根据权利要求3所述的一种数字教育资源推荐方法,其特征在于,所述将低维潜在因子提取多个粒度级别的特征向量的方法包括:

    5.根据权利要求4所述的一种数字教育资源推荐方法,其特征在于,所述将各个粒度级别的特征向量通过局部敏感哈希函数将用户隐私嵌入向量映射为对应级别的语义相关的二进制哈希码,将二进制哈希码记为用户隐私画像码并通过跨平台进行数字教育资源匹配推荐的方法包括:

    6.一种数字教育资源推荐系统,其特征在于,所述系统包括:

    7.根据权利要求6所述的一种数字教育资源推荐系统,其特征在于,所述系统还包括:

    8.根据权利要求7所述的一种数字教育资源推荐系统,其特征在于,所述特征提取模块还包括:

    9.根据权利要求8所述的一种数字教育资源推荐系统,其特征在于,所述系统还包括:

    10.根据权利要求9所述的一种数字教育资源推荐系统,其特征在于,所述系统还包括:


    技术总结
    本发明涉及数据挖掘技术领域,具体是一种数字教育资源推荐方法和系统,包括遍历数字资源平台的数字教育资源,将数字教育资源转化成可读内容并提取资源属性特征;获取用户在数字教育资源平台的行为数据,通过用户的行为数据及对应的数字教育资源的资源属性特征得到用户反馈特征,所述用户反馈特征包括用于反映用户对数字教育资源兴趣程度的用户属性特征以用于反映用户对数字教育资源兴趣程度变化趋势的用户趋势特征;提取多个粒度级别的特征向量并通过局部敏感哈希函数并进行跨平台进行数字教育资源匹配推荐。本发明通过挖掘用户和数字教育资源的特征向量并加密进行跨平台分享,解决数字教育资源平台之间的数据分享问题。

    技术研发人员:薄静,王新源,李斌
    受保护的技术使用者:河北博德文化传播有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-34044.html

    最新回复(0)