一种基于自适应图与未来偏好的下一个兴趣点推荐方法

    技术2024-12-25  42


    本发明属于推荐系统领域,应用自适应图学习与未来偏好实现的下一个兴趣点推荐方法。


    背景技术:

    1、在现代化快速发展的今天,人们对个性化服务的需求日益增加,各式各样的休闲娱乐及游玩地点层出不穷,基于位置的社交网络(lbsn)的快速发展催生了推荐系统与自身的结合,产生了poi推荐。网络地理资源的爆炸式增长导致对poi推荐的需求急剧增加,促使其蓬勃发展,并为服务提供商和用户提供有价值的地理信息。鉴于商业场景对实时性和个性化的需求日益增长,下一个poi推荐引起了学术界和产业界的广泛关注。伴随时空大数据、物联网、深度学习技术等技术的成熟,兴趣点(poi)推荐也得到了迅速的发展。在poi推荐中,签入数据之间存在着很强烈的时间和空间相关性,常用的推荐方法由于用户偏好的个性化和复杂性,导致捕获用户偏好成为很大的挑战。并且,如何兼顾全局poi节点之间的地理依赖关系也是一个亟需研究的方向。

    2、poi(point of interest)推荐是指基于用户的位置信息和历史行为,向用户推荐周围或感兴趣的地点。这种推荐系统可以帮助用户发现新的地点、规划旅行路线、找到周围的服务设施等。在进行推荐的过程中,主要有两方面的问题:一是采用基于gnn的方法来构建全局poi图。然而,基于gnn的方法受限于固定图的固有局限性:即输入图的构建受限于先验知识,统计指标的选择导致一定程度的图结构不完整和噪声,制约了表征学习的性能;二是:现有的未来偏好方法忽略了属性特征的交互作用,特别是时空信息。个人访问不仅受用户旅行计划的影响,还受不同poi之间时空关系的影响。忽略时空加权信息会将所有历史签到行为视为统一贡献,从而削弱构建其他侧面信息特征的能力。

    3、近年来,深度学习因其有对数据进行高维非线性建模的能力而受到关注,并在推荐系统中取得了良好的效果。但是大都依赖基于先验知识的预定义邻接矩阵作为全局图构建的基础,仅依靠图神经网络与预定义的邻接矩阵对图结构进行处理效果不佳。在处理用户未来偏好中,如何处理对长时序的数据进行有效的建模以及相关时空编码也是一个需要解决的问题。现有的模型并未充分考虑如何使用自适应图学习和学习用户未来偏好来建模用户最终偏好,得到推荐结果。


    技术实现思路

    1、现有的poi推荐方法,大都依赖于gnn图卷积网络和静态构建poi全局图,但是基于gnn的方法受限于固定图的固有局限性:即输入图的构建受限于先验知识,统计指标的选择导致一定程度的图结构不完整和噪声,制约了表征学习的性能,因此我们提出了使用自适应图来解决这个问题,通过相似性度量学习自适应图的邻接矩阵,从而自动推断poi之间的潜在地理关系。同时现有的未来偏好的推荐方法主要未考虑时空编码问题,为解决以上问题,本发明的目的是提出一种基于自适应图学习和未来偏好的下一个poi推荐方法。

    2、为实现上述目的,本发明采用的技术方案为:

    3、一种基于自适应图与未来偏好的下一个兴趣点推荐方法,包括如下步骤:

    4、步骤1,准备用户历史签入数据集,历史数据集包含签入地点经纬度,签入地点的类别,签入地点的时间等数据值,建立预处理的方法,构建用户的历史签入轨迹,以及初始的兴趣点邻接矩阵,得到初始输入数据。

    5、所述步骤1中,我们使用了来自纽约市,凤凰城市以及新加坡三个真实数据集,每个数据集都包含了签入的时间,签入地点类别,签入用户id等信息,以新加坡市为例,该数据集包含了8648个用户,33172个兴趣点355337条签入数据,该数据集的稀疏性为0.12%,选取该数据中的时间信息,包含小时与是否为工作日,类别信息,经纬度信息,以及用户信息作为主要的特征值,预测下一个兴趣点的推荐序列。

    6、步骤2,构建兴趣点的最终嵌入表达,其输入为兴趣点的初始嵌入向量,利用poi的初始嵌入表示,将余弦相似度作为度量函数,通过相似性度量学习自适应图的邻接矩阵,从而自动推断兴趣点之间的潜在地理关系并引入了一个阈值来对图进行稀疏化处理,并且在此基础上,对邻域信息进行了卷积聚合,得到兴趣点的最终嵌入表示并作为后续的输入。

    7、所述步骤2中,自适应图学习的整体结构如下:

    8、

    9、其中我们初始化全局poi的初始嵌入表示did表示特征维度,然后通过计算两poi之间的嵌入相似度来推断每对poi之间的依赖关系。使用余弦相似度作为度量函数,最后得到邻接矩阵a中的每个条目ai,j,这是一个全连接图,ai,j∈(-1,1),该矩阵中基于自适应图的项反映了对兴趣点之间地理依赖关系的准确估计。但这一结果会导致过多的琐碎边,从而产生噪声结构。因此引入一个阈值来进行图形稀疏化,目的是完善与空间依赖性相关的动态特征,以获得非负邻接矩阵ai,j∈(0,1),并且为了增强兴趣点的表现力,对邻域信息进行了聚合,对图中节点的初始特征进行卷积,表达如下:

    10、

    11、获取兴趣点的高阶表示使用作为兴趣点的最终嵌入表达。

    12、步骤3,构建用户长期偏好其输入为兴趣点最终嵌入表达与其他侧信息的初始嵌入进行连接得到的输入数据x所构成的用户n-1天内的历史轨迹数据其中表示由多个嵌入数据形成的用户单天用户轨迹,然后构建用户嵌入轨迹的空间间隔矩阵与时间间隔矩阵,将时空间隔矩阵编码得到时空权重ωt,ωd。其次,利用自注意力机制,以用户特定天数内的轨迹数据为输入,得到节点之间的关联权重,得到用户的长期偏好

    13、所述步骤3中,长期偏好编码器的整体结构如下:

    14、

    15、其中用户历史轨迹由用户当天签入点数据得到,序列中每个用户的签到记录都有三个特征:用户id u、poi表示类别id c。此外,由于poi与时间信息密切相关,我们增加了两个新的时间信息t来捕捉特定时间的用户活动,例如,人们喜欢在休息日去公园,晚上去酒吧。因此,这两个时间信息分别是包含2个类别的每周id特征td和包含24个类别的每小时id特征th。嵌入层将每个id特征转换成did维稠密向量,表示其为特征维数,然后池化层将所有五个嵌入合并生成序列中的签到数据x,公式如下所示:

    16、

    17、x的维度为dh=5did,轨迹表示为其中m为整条轨迹中的总签入个数。

    18、之后,考虑到用户长期偏好建模受到时空环境的影响,我们在设计长期偏好编码器时考虑了时空权重的影响。我们将两个注册点pi,pj之间的时空间隔分别记为δti,j,δdi,j。时间影响权重和距离影响权重分别记为wt(δti,j),wdδdi,j,具体来说,我们使用havercosine周期性函数捕捉用户时间周期数据,并且设置了时间衰减权重,具体公式如下:

    19、wperiod(δti,j)=hvc(2πδti,j)

    20、

    21、其中α是时间衰减率,控制权重随时间间隔δti,j下降的速度。

    22、从空间角度来看,我们认为poi离当前位置越近,对位置预测的帮助就越大。就越有助于位置预测。因此距离指数衰减权重表示:

    23、

    24、其中β是时间衰减率,控制着权重随距离间隔δdi,j下降的速度。

    25、最后,我们采用自注意力机制进行长期偏好的编码,长期偏好融合多个侧信息及时空信息得到,公式如下:

    26、

    27、其中都属于变换权重矩阵。

    28、步骤4,构建用户长期偏好hshort,其输入为当天用户的历史轨迹利用长短期记忆递归神经网络lstm,构建用户的短期偏好hshort。

    29、所述步骤4中,短期偏好hshort整体结构如下:

    30、

    31、其中,输入为当天用户的历史轨迹,短期偏好编码器从用户当前的签到行为中捕获到用户的时间感知顺序依赖性,得到用户短期偏好为hshort。

    32、短期偏好编码器的计算可以定义如下:

    33、我们利用当前轨迹sshort=(x1,x1,...xm)作为输入数据,馈入lstm网络中,具体公式如下:

    34、

    35、其中,和分别为时间戳ti与ti-1的隐藏状态。

    36、步骤5,构建用户未来偏好,考虑用户的自我活动计划,引入注意力机制,通过未来时刻嵌入表达作为查询向量,以长期偏好的隐藏状态矩阵作为内容向量,从用户的日常周期性行为中提取潜在的未来行为,获得未来时间偏好权重,这隐含模拟了用户的活动时间表将得到的时间偏好权重与短期偏好hshort结合,并以用户嵌入作为查询向量,得到用户未来偏好hf,学习用户偏好的概率分布,得到最终的预测结果。

    37、所述步骤5中,未来偏好hf整体结构如下:

    38、

    39、其中input x为通过融合融合未来行为与长期编码得到的未来时间偏好权重因为考虑到用户外出时可能会有自我活动计划,所以时间感知注意力可用于识别过去长期轨迹中与未来时间上下文最相关的行为,具体来说,用户长期轨迹被编码为隐藏状态矩阵,通过从用户的日常周期性行为中提取潜在的未来行为来获得未来时间偏好权重。使用未来时间嵌入tk+1作为查询向量,公式如下:

    40、

    41、之后通过连接方式将权重与短期偏好结合生成表征用户偏好的隐藏状态用户最终的未来偏好是由中的每个隐藏状态汇总而成的,因此用户最终未来偏好为:

    42、

    43、其中u表示用户嵌入表示。之后我们学习用户偏好的概率分布,解码兴趣点:

    44、

    45、其中是一个变换矩阵。


    技术特征:

    1.一种基于自适应图与未来偏好的下一个兴趣点推荐方法,包括如下步骤:

    2.根据权利要求1所述的一种基于自适应图与未来偏好的下一个兴趣点推荐方法,其特征在于:所述步骤1中,我们使用了来自纽约市,凤凰城市以及新加坡三个真实数据集,每个数据集都包含了签入的时间,签入地点类别,签入用户id等信息,以新加坡市为例,该数据集包含了8648个用户,33172个兴趣点355337条签入数据,该数据集的稀疏性为0.12%,选取该数据中的时间信息,包含小时与是否为工作日,类别信息,经纬度信息,以及用户信息作为主要的特征值,预测下一个兴趣点的推荐序列。

    3.根据权利要求1所述的一种基于自适应图与未来偏好的下一个兴趣点推荐方法,其特征在于:所述步骤2中,自适应图学习的整体结构如下:

    4.根据权利要求1所述的一种基于自适应图与未来偏好的下一个兴趣点推荐方法,其特征在于:所述步骤3中,长期偏好编码器的整体结构如下:

    5.根据权利要求1所述的一种基于自适应图与未来偏好的下一个兴趣点推荐方法,其特征在于,所述步骤4中,短期偏好hshort整体结构如下:

    6.根据权利要求1所述的一种基于自适应图与未来偏好的下一个兴趣点推荐方法,其特征在于,所述步骤5中,未来偏好hf整体结构如下:


    技术总结
    本发明公开了一种基于自适应图与未来偏好的下一个兴趣点推荐方法,包括如下步骤:准备兴趣点历史签入数据集,数据集包括用户历史签入地点,签入时间,签入地点类别等信息,并对数据进行标准化处理;初始化POI节点嵌入信息,利用自适应图进行全局邻接矩阵的构建,利用相似度函数和卷积网络得到兴趣点最终嵌入表达;将时空节点编码信息与其他侧信息融合兴趣点嵌入表达,引入自注意机制,编码得到用户的长期偏好;之后利用长短期记忆递归神经网络,融合兴趣点的侧信息,引入注意力机制,得到用户的短期偏好;随后将长期偏好与短期偏好以自组装方式,加入注意力机制,以下一步时间时刻编码作为查询向量,捕捉下一个兴趣点的关联关系。本发明选择自适应图和图神经网络,可以对真实的兴趣点进行关联捕获,具有很好的推荐性能。

    技术研发人员:李肖雪,李博涵,刘昕悦,殷崭祚,徐泽坤
    受保护的技术使用者:南京航空航天大学
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-24239.html

    最新回复(0)