结合深度学习和协同过滤的推荐方法与流程

    技术2025-01-06  42


    本技术涉及推荐算法领域,尤其涉及一种结合深度学习和协同过滤的推荐方法。


    背景技术:

    1、随着信息技术的快速发展,推荐系统在各种应用场景中发挥着越来越重要的作用。然而典型的推荐方法通常存在一定的局限性,如何提高推荐的准确性和个性化程度是尚未解决的。


    技术实现思路

    1、本技术实施例提供了一种结合深度学习和协同过滤的推荐方法。

    2、第一方面,本技术实施例提供了一种结合深度学习和协同过滤的推荐方法,该方法包括:

    3、汇集数据,数据包括用户画像数据、推荐目标画像数据、用户行为数据;

    4、构建用户及推荐目标标签体系,标签体系包括用户或推荐目标的多种标签大类;

    5、结合汇集的数据及构建的标签体系,进行用户及推荐目标的标签标记;

    6、应用协同过滤算法进行目标的推荐召回,其中用户之间相似度矩阵、推荐目标之间相似度矩阵以及用户对推荐目标的偏好矩阵基于用户对推荐目标的浏览行为确定;

    7、应用深度学习算法进行目标的推荐召回,其中深度学习算法的输入包括协同过滤算法的推荐结果、用户的特征以及候选推荐目标的特征,用户的特征以及候选推荐目标的特征基于汇集的数据以及标签体系确定;

    8、基于协同过滤算法和深度学习算法的推荐结果,计算候选推荐目标的综合推荐度,综合推荐度基于下式确定:

    9、

    10、其中,rk表示综合推荐度,表示用户i应用协同过滤算法得到的第k个候选推荐对象的推荐度;表示用户i应用深度学习算法得到的第k个候选推荐对象的推荐度;α为超参数,取值为0-1,默认取值0.5;

    11、根据综合推荐度对候选推荐目标进行排序,基于排序结果确定最终推荐目标。

    12、可选的,标签标记的结果基于人工打标、规则打标以及人工智能ai打标的综合结果确定,其中人工打标用于对全部数据进行打标,规则打标用于对数据中的结构化数据进行打标,ai打标用于对数据中的非结构化数据文本进行打标。

    13、可选的,ai打标基于大模型的提示工程进行,ai打标包括:

    14、基于大模型的最大构建块限制切分文本,得到文本切块结果集合;

    15、对于文本切块结果集合中的文本块和标签大类,构建基于大模型打标的提示工程,提示工程用于指示大模型根据标签大类对文本块进行打标;

    16、将文本块、提示工程输入大模型,得到基于大模型的ai打标结果。

    17、可选的,用户之间的相似度矩阵为:

    18、

    19、其中,表示用户i与用户j的相似度,基于下式确定:

    20、

    21、其中,表示用户i、j的第u个标签特征取值(即是否命中该标签,0或1);基于用户i的标签特征向量确定,用户i的标签特征向量为表示用户i第l个标签特征取值(即是否命中该标签,0或1);基于用户j的标签特征向量确定,用户j的标签特征向量为表示用户i第l个标签特征取值(即是否命中该标签,0或1);n(i,j)表示用户i、j都浏览过的推荐目标集合;n(i)表示用户i浏览过的推荐目标集合;n(j)表示用户j浏览过的推荐目标集合;|n(i,j)|、|n(i)|、n(j)表示集合中元素的个数;hiu、hju表示用户i、j浏览推荐目标u关联网页内容次数、每次浏览时长的综合得分;表示用户i、j对所有推荐目标的综合得分均值。

    22、可选的,推荐目标之间的相似度矩阵为:

    23、

    24、其中,表示推荐目标i与推荐目标j的相似度,可以基于下式确定:

    25、

    26、其中,表示推荐目标对象i、j的第u个标签特征取值(即是否命中该标签,0或1);m(i,j)表示浏览过推荐目标i和j的用户集合;m(i)表示浏览过推荐目标i的用户集合;m(j)表示浏览过推荐目标j的用户集合;|m(i,j)|、|m(i)|、m(j)表示集合中元素的个数;hui、huj表示用户i、j浏览推荐目标u关联网页内容次数、每次浏览时长的综合得分;表示用户i、j对所有推荐目标的综合得分均值。

    27、可选的,用户对推荐目标的偏好矩阵为:

    28、

    29、其中,表示用户i对推荐目标j的偏好度,可以基于下式确定:

    30、

    31、其中,p(i,j)表示用户i浏览过与推荐目标j相似度大于0.5的推荐目标集合,p(i)表示用户i浏览过的推荐目标集合,hij表示用户i浏览推荐目标j关联网页内容次数、每次浏览时长的综合得分;|p(i,j)|、|p(i)|表示集合中元素的个数,p(i,j)基于下式确定:

    32、

    33、其中表示推荐目标j与推荐目标w的相似度;hiw表示用户i浏览推荐目标w关联网页内容次数、每次浏览时长的综合得分;

    34、p(i)基于下式确定:

    35、p(i)={w|hiw>0}。

    36、可选的,用户对推荐目标的浏览行为矩阵为:

    37、

    38、其中,hij表示用户i浏览推荐目标j关联网页内容的次数、每次浏览时长的综合得分,hij基于下式确定:

    39、

    40、其中,secij表示用户i浏览推荐目标j关联网页的平均时长(单位:秒);countij表示用户i浏览推荐目标j关联网页的次数;lengthij表示推荐目标j关联网页的文本字符个数。

    41、可选的,深度学习算法为多任务学习算法中的共享底层算法。

    42、可选的,用户为企业,推荐目标为政策项目和/或资讯。

    43、可选的,标签体系包括以下中的一种或多种标签大类:企业类型;行业分类;产业类别;企业注册年限;地理位置;资助资质或奖励;营业收入情况;销售额情况;产值情况;信用情况;处罚情况;业务偏好。

    44、第二方面,本技术实施例提供了一种电子装置,包括:

    45、汇集单元,用于汇集数据,数据包括用户画像数据、推荐目标画像数据、用户行为数据;

    46、构建单元,用于构建用户及推荐目标标签体系,标签体系包括用户或推荐目标的多种标签大类;

    47、标记单元,用于结合汇集的数据及构建的标签体系,进行用户及推荐目标的标签标记;

    48、第一推荐单元,用于应用协同过滤算法进行目标的推荐召回,其中用户之间相似度矩阵、推荐目标之间相似度矩阵以及用户对推荐目标的偏好矩阵基于用户对推荐目标的浏览行为确定;

    49、第二推荐单元,用于应用深度学习算法进行目标的推荐召回,其中深度学习算法的输入包括协同过滤算法的推荐结果、用户的特征以及候选推荐目标的特征,用户的特征以及候选推荐目标的特征基于汇集的数据以及标签体系确定;

    50、计算单元,用于基于协同过滤算法和深度学习算法的推荐结果,计算候选推荐目标的综合推荐度,综合推荐度基于下式确定:

    51、

    52、其中,rk表示综合推荐度,表示用户i应用协同过滤算法得到的第k个候选推荐对象的推荐度;表示用户i应用深度学习算法得到的第k个候选推荐对象的推荐度;α为超参数,取值为0-1,默认取值0.5;

    53、排序单元,用于根据综合推荐度对候选推荐目标进行排序,基于排序结果确定最终推荐目标。

    54、可选的,标签标记的结果基于人工打标、规则打标以及人工智能ai打标的综合结果确定,其中人工打标用于对全部数据进行打标,规则打标用于对数据中的结构化数据进行打标,ai打标用于对数据中的非结构化数据文本进行打标。

    55、可选的,ai打标基于大模型的提示工程进行,ai打标包括:

    56、基于大模型的最大构建块限制切分文本,得到文本切块结果集合;

    57、对于文本切块结果集合中的文本块和标签大类,构建基于大模型打标的提示工程,提示工程用于指示大模型根据标签大类对文本块进行打标;

    58、将文本块、提示工程输入大模型,得到基于大模型的ai打标结果。

    59、可选的,用户之间的相似度矩阵为:

    60、

    61、其中,表示用户i与用户j的相似度,基于下式确定:

    62、

    63、其中,表示用户i、j的第u个标签特征取值(即是否命中该标签,0或1);基于用户i的标签特征向量确定,用户i的标签特征向量为表示用户i第l个标签特征取值(即是否命中该标签,0或1);基于用户j的标签特征向量确定,用户j的标签特征向量为表示用户i第l个标签特征取值(即是否命中该标签,0或1);n(i,j)表示用户i、j都浏览过的推荐目标集合;n(i)表示用户i浏览过的推荐目标集合;n(j)表示用户j浏览过的推荐目标集合;|n(i,j)|、|n(i)|、n(j)表示集合中元素的个数;hiu、hju表示用户i、j浏览推荐目标u关联网页内容次数、每次浏览时长的综合得分;表示用户i、j对所有推荐目标的综合得分均值。

    64、可选的,推荐目标之间的相似度矩阵为:

    65、

    66、其中,表示推荐目标i与推荐目标j的相似度,可以基于下式确定:

    67、

    68、其中,表示推荐目标对象i、j的第u个标签特征取值(即是否命中该标签,0或1);m(i,j)表示浏览过推荐目标i和j的用户集合;m(i)表示浏览过推荐目标i的用户集合;m(j)表示浏览过推荐目标j的用户集合;|m(i,j)|、|m(i)|、m(j)表示集合中元素的个数;hui、huj表示用户i、j浏览推荐目标u关联网页内容次数、每次浏览时长的综合得分;表示用户i、j对所有推荐目标的综合得分均值。

    69、可选的,用户对推荐目标的偏好矩阵为:

    70、

    71、其中,表示用户i对推荐目标j的偏好度,可以基于下式确定:

    72、

    73、其中,p(i,j)表示用户i浏览过与推荐目标j相似度大于0.5的推荐目标集合,p(i)表示用户i浏览过的推荐目标集合,hij表示用户i浏览推荐目标j关联网页内容次数、每次浏览时长的综合得分;|p(i,j)|、|p(i)|表示集合中元素的个数,p(i,j)基于下式确定:

    74、

    75、其中表示推荐目标j与推荐目标w的相似度;hiw表示用户i浏览推荐目标w关联网页内容次数、每次浏览时长的综合得分;

    76、p(i)基于下式确定:

    77、p(i)={w|hiw>0}。

    78、可选的,用户对推荐目标的浏览行为矩阵为:

    79、

    80、其中,hij表示用户i浏览推荐目标j关联网页内容的次数、每次浏览时长的综合得分,hij基于下式确定:

    81、

    82、其中,secij表示用户i浏览推荐目标j关联网页的平均时长(单位:秒);countij表示用户i浏览推荐目标j关联网页的次数;lengthij表示推荐目标j关联网页的文本字符个数。

    83、可选的,深度学习算法为多任务学习算法中的共享底层算法。

    84、可选的,用户为企业,推荐目标为政策项目和/或资讯。

    85、可选的,标签体系包括以下中的一种或多种标签大类:企业类型;行业分类;产业类别;企业注册年限;地理位置;资助资质或奖励;营业收入情况;销售额情况;产值情况;信用情况;处罚情况;业务偏好。

    86、第三方面,本技术实施例提供了一种电子设备,包括存储器、至少一个处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述第一方面中任一项所述的方法。

    87、第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的方法。

    88、第五方面,本技术实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述第一方面中任一项所述的方法。

    89、基于本技术,可以通过融合协同过滤、深度学习推荐方法构建混合推荐方法,综合二者推荐技术方法的优势,可以克服单一方法的局限性,提高推荐的准确性和个性化程度。


    技术特征:

    1.一种结合深度学习和协同过滤的推荐方法,其特征在于,包括:

    2.根据权利要求1所述的方法,其特征在于,所述标签标记的结果基于人工打标、规则打标以及人工智能ai打标的综合结果确定,其中所述人工打标用于对全部所述数据进行打标,所述规则打标用于对所述数据中的结构化数据进行打标,所述ai打标用于对所述数据中的非结构化数据文本进行打标。

    3.根据权利要求2所述的方法,其特征在于,所述ai打标基于大模型的提示工程进行,所述ai打标包括:

    4.根据权利要求3所述的方法,其特征在于,所述用户之间的相似度矩阵为:

    5.根据权利要求4所述的方法,其特征在于,所述推荐目标之间的相似度矩阵为:

    6.根据权利要求5所述的方法,其特征在于,所述用户对所述推荐目标的偏好矩阵为:

    7.根据权利要求6所述的方法,其特征在于,所述用户对推荐目标的浏览行为矩阵为:

    8.根据权利要求7所述的方法,其特征在于,所述深度学习算法为多任务学习算法中的共享底层算法。

    9.根据权利要求8所述的方法,其特征在于,所述用户为企业,所述推荐目标为政策项目和/或资讯。

    10.根据权利要求9所述的方法,其特征在于,所述标签体系包括以下中的一种或多种标签大类:


    技术总结
    本申请提供了一种结合深度学习和协同过滤的推荐方法。本申请中,可以通过融合协同过滤、深度学习推荐方法构建混合推荐方法,综合二者推荐技术方法的优势,可以克服单一方法的局限性,提高推荐的准确性和个性化程度。

    技术研发人员:李晓琼,巩福,陈吉
    受保护的技术使用者:深圳太极数智技术有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-24638.html

    最新回复(0)