本发明属于网络舆情分析领域,具体涉及一种基于认知差异的跨平台话题传播趋势预测方法。
背景技术:
1、大规模的社交网络(如facebook、twitter、新浪微博等)加快了信息共享的速度和范围,人们的日常生活已经离不开社交网络,成为了引导型话题传播的重要渠道。引导型话题具有模糊性和误导性的特点,可能对人们的日常工作、生活以及社会公共安全造成极大的危害。社交网络平台的多样化以及网民同时在多个平台上注册信息,导致引导性话题的传播一般不会只在单平台社交网络中传播,而是在跨平台社交网络中快速扩散。引导型话题的传播是利弊共存的,正面话题能引导正确的价值理念,创造良好的网络环境,但负面话题往往会对经济社会造成恶劣的影响,甚至关乎国家安全问题,因此分析跨平台社交网络中的引导型话题传播规律,对形成有效的跨平台社交网络引导型话题传播管控和引导措施具有一定的理论意义和现实意义。
2、目前,引导型话题仍是学术界的重点议题,研究内容主要包括引导性话题的传播和控制两个方面。针对引导型话题传播,建立基于经典流行并传染模型sir的话题传播模型,通过研究信息传播的动力学成因与对sir模型改进,构建状态转换方程来探究话题传播规律。针对引导性话题的控制,在引导型话题传播模型的基础上,引入控制策略,为有关媒体和部门制定预防和监管措施提供理论依据。
3、在研究过程中,发现了一个共同的现象:在话题产生之后,通常用户是影响话题传播的重要因素,个体认知差异会影响用户对话题的判断以及传播与否,这种认知差异通常与用户的记忆水平、主观倾向等直接相关。
4、围绕这一引导性话题的传播规律,众多学者已经展开了一系列研究,但对于跨平台引导性话题的传播的研究还存在如下的挑战:
5、1、用户影响力量化的复杂性。用户的认知差异性会导致对同一话题采取不同的处理方式,表明除了话题本身的因素,用户的认知因素成为影响观点传播的重要影响因素。如何将用户的认知量化并引入状态转换方程成为挑战。
6、2、引导型话题层内传播的复杂性。社交话题网络信息错综复杂,每个用户的个体特征和外部环境是不同的。因此,在观点传播过程中,个体认知水平的差异会导致用户对话题产生不同的观点。如何在考虑个体特征差异性的条件下引入状态转换方程并分析话题的传播成为挑战。
7、3、引导型话题跨平台传播的复杂性。在实际的话题传播过程中,信息通常在多个社交平台中交互传播,如何在层内和耦合网络层间中分析话题传播规律成为挑战。
技术实现思路
1、为了解决背景技术中存在的问题,本发明提供一种基于认知差异的跨平台话题传播趋势预测方法,具体包括以下步骤:
2、s1、使用社交网络的api接口获取到待检测话题对应的话题相关数据与话题的用户信息数据;
3、s2、对话题数据进行消息内部因素特征提取和用户外部认知因素特征提取,根据提取的特征计算出用户的信息感知力、用户的话题意识度、话题流行度以及邻居传播推动力;
4、s3、利用多元线性回归模型,基于用户的信息感知力、用户的话题意识度、话题流行度以及邻居传播推动力计算出用户的认知对于传播话题信息的影响力;
5、s4、考虑实际的话题传播,通过用户的认知对于传播话题信息的影响力结合跨平台传播机制计算得到用户跨平台传播话题的概率;
6、s5、根据用户独立转发概率和跨平台状态转换概率构建传播动力学方程;
7、s6、求解动力学方程,得到考虑用户认知差异对话题传播的影响,并计算话题的传播趋势。
8、进一步地,根据提取的特征计算出用户的信息感知力包括:
9、
10、其中,per(ui)表示第i个用户ui的信息感知力;fol(ui)表示第i个用户ui的关注数量;fol(net)表示网络中的平均关注数量。
11、进一步地,根据提取的特征计算出用户的话题意识度包括:
12、
13、其中,aware(ui)表示第i个用户ui的话题意识度;num[orig(ui)]表示第i个用户ui在话题传播前一段时间发表的原创话题数量;num[retw(ui)]表示第i个用户ui在话题传播前一段时间转发话题数量;num[orig(un)]表示第i个用户ui关注的所有用户集合un发表的原创话题数量;num[retw(un)]表示第i个用户ui关注的所有用户集合un转发话题数量;α、β为弱化系数,且α、β∈[0,1]。
14、进一步地,根据提取的特征计算出话题流行度包括:
15、
16、其中,pop(t)表示话题在时刻t的流行度;num(topic)表示话题topic的转发数量和评论数量之和;t0为话题传播的最初时刻;λ为热度衰减因子。
17、进一步地,根据提取的特征计算出邻居传播推动力包括:
18、
19、其中,dri(ui)表示第i个用户ui的邻居传播推动力;b表示弱化系数;
20、表示第i个用户ui的邻居节点在话题发起前一段时间发表的全部话题的平均浏览量;表示第i个用户ui的邻居节点在话题发起前一段时间发表的平均评论数;表示第i个用户ui的邻居节点在话题发起前一段时间发表的平均转发量。
21、进一步地,利用多元线性回归模型计算出用户的认知对于传播话题信息的影响力的过程包括:
22、eff(ui)=β0+β1*facuser(ui)+β2*factopic(ui)
23、其中,eff(ui)表示第i个用户ui对应的邻居传播推动力;β0、β1、β2为偏回归系数;facuser(ui)表示用户因素对话题传播的影响,表示为facuser(ui)=per(ui)×aware(ui),per(ui)表示第i个用户ui的信息感知力,aware(ui)表示第i个用户ui的话题意识度;factopic(ui)表示话题自身因素对话题传播的影响,表示为factopic(ui)=dri(ui)*pop(t),dri(ui)表示第i个用户ui的邻居传播推动力,pop(t)表示话题在时刻t的流行度。
24、进一步地,考虑实际的话题传播,结合跨平台传播机制计算得到用户跨平台传播话题的概率包括:
25、β(a,b)=β+(1-β)×k(a,b)
26、其中,β(a,b)表示用户跨平台传播的概率;β表示在社交网络中从传播状态转换为传播状态的概率;k(a,b)表示两个平台之间的相互作用。
27、进一步地,两个平台之间的相互作用k(a,b)表示为:
28、
29、其中,topic(a)表示网络平台a中话题的关键词或标签;topic(b)表示网络平台b中话题的关键词或标签。
30、进一步地,结合话题传播的单向性计算得到任一用户ui在t时刻转发该层话题的概率包括:
31、若用户节点ui有m个邻居节点,其中t时刻已经有n个邻居节点转发该话题的前提下,用户节点ui转发该话题的概率表示为:
32、
33、因此,能够计算得到用户节点ui在t时刻转发的概率为:
34、
35、其中,p(t)表示t时刻用户跨平台传播话题的概率,网络中所有用户在t时刻转发概率的平均值作为跨平台转发概率;m表示第i个用户ui的邻居数量,在本发明中,与当前用户节点存在邻居关系的用户节点可以是与当前用户节点存在好友关系的用户节点,也可以是与当前用户节点存在点赞、转发、评论等关联的用户节点;n表示转发话题信息的邻居数量;表示m个邻居组成n个邻居的组合数量;eff(ui)表示第i个用户ui对应的传播话题影响力。
36、进一步地,针对一个话题,在一个社交网络中包括四个状态的用户,即未知该话题的用户处于未知状态、已知该话题的用户处于已知状态、传播该话题的用户处于传播状态、不会传播该话题的用户处于免疫状态,未知该话题的用户以一定概率转变为已知该话题的用户,已知该话题的用户以用户一定的概率在当前社交网络转发该话题消息、以跨平台状态转换概率在其他社交网络转发该话题消息,当前网络中已知该话题的用户以一定概率转换为另一个社交网络中免疫该话题的用户,即得到第i个网络平台的传播动力学方程表示为:
37、
38、结合平均场理论,得到t时刻的传播概率为为网络中所有用户在t时刻转发概率的平均值,用θ表示平台之间的关相互作用系数,即令θ=k(i,i+1),得到动力学方程:
39、
40、其中,si(t)表示t时刻第i个社交网络中处于未知状态的用户占比,ei(t)表示t时刻第i个社交网络中处于已知状态的用户占比,ii(t)表示t时刻第i个社交网络中处于传播状态的用户占比,ri(t)表示t时刻第i个社交网络中处于免疫状态的用户占比;αi表示第i个平台从未知状态转换为已知状态的概率;γ1i表示第i个平台从未知状态转换为免疫状态的概率;βi表示第i个平台从已知状态转换到传播状态的概率;β(i,i+1)表示第i个平台与第i+1个平台之间跨平台传播概率;γ2i表示第i个平台从已知状态转换为免疫状态的概率;k(i,i+1)表示第i个平台与第i+1个平台之间的相互作用系数;ηi表示第i个平台从传播状态转换为免疫状态的概率;γ2(i+1)表示第i+1个平台从已知状态到传播状态的概率;表示用户转发话题信息的独立概率。
41、本发明的有益效果为:本发明考虑到现实话题传播的特征,考虑到用户的认知差异性以及用户受到大量无法辨识真伪的信息的冲击,用户对于信息所持的态度不再局限于未知、感兴趣从而进行传播、不感兴趣从而拒绝传播三种状态,更多的是处于已知该信息,并观望该信息的发展的状态。因此该模型在传统sir模型的基础上增加了已知状态。不仅可以更加准确的预测社交网络中引导类话题传播趋势,还可以分析出用户的认知对整个话题传播过程中的影响,通过跨平台传播机制,设计了一种基于用户认知的跨平台话题传播模型。通过引入经典传染病模型建立基于用户认知的跨平台话题传播模型,该模型能够准确描述用户在接触到引导信息后的传播态势,可应用于预测话题走向和控制话题。本发明也可以为企业、政府或个人提供更有效的信息传播策略,帮助他们更好地利用社交网络平台进行信息传播和营销推广。
1.一种基于认知差异的跨平台话题传播趋势预测方法,其特征在于,具体包括以下步骤:
2.根据权利要求1所述的一种基于认知差异的跨平台话题传播趋势预测方法,其特征在于,根据提取的特征计算出用户的信息感知力包括:
3.根据权利要求1所述的一种基于认知差异的跨平台话题传播趋势预测方法,其特征在于,根据提取的特征计算出用户的话题意识度包括:
4.根据权利要求1所述的一种基于认知差异的跨平台话题传播趋势预测方法,其特征在于,根据提取的特征计算出话题流行度包括:
5.根据权利要求1所述的一种基于认知差异的跨平台话题传播趋势预测方法,其特征在于,根据提取的特征计算出邻居传播推动力包括:
6.根据权利要求1所述的一种基于认知差异的跨平台话题传播趋势预测方法,其特征在于,利用多元线性回归模型计算出用户的认知对于传播话题信息的影响力的过程包括:
7.根据权利要求1所述的一种基于认知差异的跨平台话题传播趋势预测方法,其特征在于,考虑实际的话题传播,结合跨平台传播机制计算得到用户跨平台传播话题的概率包括:
8.根据权利要求7所述的一种基于认知差异的跨平台话题传播趋势预测方法,其特征在于,两个平台之间的相互作用k(a,b)表示为:
9.根据权利要求1所述的一种基于认知差异的跨平台话题传播趋势预测方法,其特征在于,结合话题传播的单向性计算得到任一用户ui在t时刻转发该层话题的概率包括:
10.根据权利要求1所述的一种基于认知差异的跨平台话题传播趋势预测方法,其特征在于,针对一个话题,在一个社交网络中包括四个状态的用户,即未知该话题的用户处于未知状态、已知该话题的用户处于已知状态、传播该话题的用户处于传播状态、不会传播该话题的用户处于免疫状态,未知该话题的用户以一定概率转变为已知该话题的用户,已知该话题的用户以用户一定的概率在当前社交网络转发该话题消息、以跨平台状态转换概率在其他社交网络转发该话题消息,当前网络中已知该话题的用户以一定概率转换为另一个社交网络中免疫该话题的用户,即得到第i个网络平台的传播动力学方程表示为: