本发明涉及攻防博弈算法,尤其是一种基于超博弈的算力网络攻防对抗博弈模型。
背景技术:
1、随着5g、云计算、边缘计算和移动互联网技术的不断发展,ar/vr、车联网等新型网络业务和应用的不断成熟,计算资源呈现出无处不在的部署趋势。为了更高效利用海量分布式计算资源,满足急迫的算力需求,推动边缘计算与网络深入整合,算力网络得到了广泛的关注。算力网络是一个边-端-云的分布式网络结果,旨在通过动态整合和共享计算资源和网络资源,将分布的计算节点连接起来,形成算力可感知,可分配的网络系统。
2、相较于传统的网络安全威胁,算力网络拥有高度泛化、跨区域整合、算网一体、灵活连接性等特征,从而带来更广泛的安全暴露面和更高的数据连接频次,也显著提高了资源受攻击的风险,对网络安全策略提出了新的挑战。算力网络由于其独特的架构和用途,在面对分布式攻击,僵尸网络攻击时表现出与传统网络不同的脆弱性和维护挑战。由于通常使用简单的处理器和操作系统,算力网络的边缘设备往往无法支持复杂的安全防御方案,更加容易成为攻击的切入点与攻击傀儡,而云端的控制平面受到攻击将导致整体网络的故障。
3、对于算力网络下的防御策略,现有的网络安全防御策略主要包括防火墙,补丁管理,节点维护等,此外,还包括将欺骗性防御策略。欺骗性防御策略包括蜜罐和蜂蜜信息。蜜罐策略即在给定的网络拓扑中部署一些蜜罐节点,构建蜜罐网络,引诱攻击者攻击蜜罐节点。蜜罐节点主要负责识别和干扰攻击者的行动,破坏蜜罐节点不会对网络完整造成影响,攻击者不能从蜜罐节点达到常规节点。蜂蜜信息即传播虚假信息来干扰攻击者行动。
4、博弈论是一套有效的攻击者-防御者模型分析工具,旨在帮助理解在多个攻防决策主体相互作用的情境中所呈现的行为模式和决策动态。现有的博弈假设中假设博弈双方拥有同样的视角,参与者双方拥有相同且完善的公有知识与全局理解。然而,现实冲突中,对于博弈的有限认知和不完全信息可能导致各决策者可能无法正确认知博弈相关信息,各决策者对于所处博弈状态的主观认知偏好将进一步影响博弈策决策与最终结果,从而严重影响防御结果。
技术实现思路
1、针对现有技术的不足,本发明提供一种基于超博弈的算力网络攻防对抗博弈模型,本发明通过构建的基于算力网络节点的多阶段博弈算力网络攻防模型,在特定算力网络拓扑下实现攻防博弈过程,并在各个博弈阶段实现有效决策。
2、本发明的技术方案为:一种基于超博弈的算力网络攻防对抗博弈模型,所述的模型的构建包括如下步骤:
3、s1)、设计算力网络架构,将算力网络简化为三级节点的分布式网络;
4、s2)、基于参与者对攻防博弈的理解,构建可能存在的子博弈集,初始化参与者对可能存在子博弈的发生情况的信念以及参与者对当前信念的不确定度;
5、s3)、基于特定算力网络状态下,对当前可能进行的子博弈中存在的所有攻防策略计算收益矩阵,并结合感知参数构建超博弈范式矩阵;
6、s4)、基于超博弈范式矩阵,综合考虑参与者的策略预期收益以及对可能的最坏情况,计算各个策略的超博弈预期效用;
7、s5)、参与者选择能够最大化预期效用的策略,根据双方参与者的策略选择更新网络节点状态,以及参与者的不确定度;
8、s6)、参与者在每个博弈阶段选择满足最大化预期效用函数的策略进行行动,并对算力网络状态造成影响,直到算力网络系统崩溃。
9、作为优选的,步骤s1)中,所述的三级节点的分布式网络为边-端-云的三级节点层次互联的分布式网络,并在云端实现防御策略统一部署,引入虚假节点实现蜜罐网络。
10、作为优选的,步骤s2)中,所述的子博弈集包括四个可能存在子博弈,分别为:
11、子博弈1:防御者不会使用欺骗策略集合;
12、子博弈2:防御者使用欺骗策略——蜜罐;
13、子博弈3:防御者使用欺骗策略——蜂蜜信息;
14、子博弈4:防御者使用欺骗策略——蜜罐、蜂蜜信息。
15、作为优选的,步骤s2)中,所述的防御者使用的欺骗策略为包含蜜罐网络和蜂蜜信息的欺骗性防御策略。
16、作为优选的,步骤s3)中,对于特定攻击策略和防御策略下的攻防收益矩阵,其计算如下:
17、s31)、定义系统的损失函数:
18、
19、式中,av为定义算力网络需要提供的最小算力,poweri为节点i的初始化算力,avi为节点的可用状态,ndi为节点i的受损程度,vali为节点重要性参数,p2为可接受网络受损程度比例,max定义为一个极大值,作为系统受损导致网络不可用的惩罚;
20、s32)、收益函数:所述的模型使用网络整体受损程度评估策略对算力网络造成的影响,表示玩家行使各个策略带来的收益;
21、impact(di,sj,aq)=sf*-sf;
22、式中,di为防御者采用的常规防御策略i,sj为防御者采用的欺骗策略j,aq为攻击者采用的攻击策略q,sf*表示执行策略之后系统受损程度,sf表示执行策略之前系统受损程度;
23、s33)、定义防御者的效用函数:
24、ud(di,sj,aq)=-costd(di,sj)+impact(di,sj,aq)*μ+aff(t)*θ;
25、式中,di为防御者采用的常规防御策略i,sj为防御者采用的欺骗策略j,aq为攻击者采用的攻击策略q,impact(di,sj,aq)表示策略组合对系统的结构完整性的影响,μ为影响权重,aff(t)为欺骗策略的长期收益,θ为长期收益权重;
26、s34)、定义攻击者的效用函数
27、
28、其中di为防御者采用的常规防御策略i,sj为防御者采用的欺骗策略j,aq为攻击者采用的攻击策略q,impact(di,sj,aq)表示策略组合对系统的结构完整性的影响,为对应权重,aff(t)为欺骗策略的长期收益,v为长期收益权重;
29、s35)、定义执行防御策略的成本函数
30、
31、式中,当取sj=s1时,防御者第一次使用欺骗性防御策略s1,基于设计的蜜罐节点数量定义欺骗策略成本为honeynode集合表示为设定的蜜罐节点集合,stage表示博弈阶段即策略s1的成本随博弈进行递减;对于sj=s2,蜂蜜信息仅作用于当前博弈阶段,定义其中cdi,cs1,cs2均来自先验公共知识;
32、s36)、对于攻击者,划定攻击者选择攻击策略aq,将策略aq应用在策略对应节点集合anode当中,caq来自先验公共知识,定义执行攻击策略的成本函数为:
33、
34、作为优选的,步骤s4)中,所述的超博弈预期效用的表达式如下:
35、heu(rx)=(1-gd)×eu(rx,aall)+gd×euworst(rx,aall);
36、heu(aq)=(1-ga)×eu(rall,aq)+ga×euworst(rall,aq);
37、式中,rx=(di,sj)为将经典防御策略与防御性欺骗策略视为一个策略组合,将攻防双方的策略空间限制的二维平面,gd表示参与者对当前博弈感知的不确定度,eu(rx,aall)表示策略组合rx的预期效用,eu(rall,aq)表示攻击策略aq的预期效用,ga表示攻击者对博弈的不确定度,euworst(rx,aall)表示参与者采用策略集合中的最坏情况。
38、作为优选的,步骤s4)中,所述的超博弈预期效用用于评估当列玩家在所有可用策略中选择一个策略时,行玩家在选择策略i时的预期效用:
39、
40、euworst(rx,aall)=n*min{ud(rx,aq),aq∈aset}*wmin;
41、
42、euworst(rall,aq)=m*min{ua(rx,aq),rx∈rset}*wmin;
43、式中,wq为攻击策略q被选择的概率,ud(rx,aq)为策略组合ud(rx,aq)的防御者效用;wmin为最坏策略被选择的概率;wx为防御策略组合rx被选择的概率,ua(rx,aq)为策略组合ud(rx,aq)的攻击者效用;n、m分别为防御策略数量和攻击策略数量。
44、作为优选的,步骤s4)中,基于超博弈范式,行参与者对于列参与者选择策略j的概率表达式如下:
45、
46、式中,pk为行参与者认为子博弈k进行的概率,colkj为在子博弈k中,行参与者认为列参与者采取策略j的概率,wj为在超博弈中,行参与者认为列参与者采取策略j的概率;
47、基于超博弈定义参与者对于可能存在的子博弈的感知,对于策略收益矩阵中的参与者和列参与者,定义在行参与者认知中列参与者在子博弈k中的使用策略i的概率为:
48、
49、式中,cmsk为子博弈k中,行参与者认为列参与者选择策略的偏好向量;
50、定义行参与者在子博弈k中的偏好向量为:
51、
52、式中,rmsk为子博弈k中,行参与者选择策略的偏好向量,rowki为在子博弈k中,行参与者选择策略i的概率;
53、定义行参与对超博弈的信念,即行参与者认为列参与者选择进行子博弈j的概率为:
54、
55、式中,pk为行参与者认为子博弈k进行的概率;
56、作为优选的,步骤s5)中,防御者策略与攻击者策略将直接带来节点受损状态的变化,其中算力网络节点状态变化如下:
57、
58、其中,ndi表示当前节点i的受损程度,e(di,sj,aq)表示防御策略组合(di,sj)以及攻击策略aq对节点受损程度的影响,为更新后节点i的受损程度。
59、本发明的有益效果为:
60、1、本发明实现了算力网络下攻防博弈过程的建模,并将防御性欺骗策略纳入防御策略集合中,在攻击者和防御者对博弈的不同初始感知下,实现多阶段攻防博弈,验证基于超博弈范式的决策方法和欺骗策略的有效性;
61、2、本发明构建基于特定网络拓扑下可用于博弈推理的算力网络模型,考虑完全信息下的混合纳什均衡决策和不完全信息下超博弈决策方法,验证参与者对博弈的不完全感知对博弈结果和过程的影响。
1.一种基于超博弈的算力网络攻防对抗博弈模型,其特征在于,所述的模型的构建包括如下步骤:
2.根据权利要求1所述的一种基于超博弈的算力网络攻防对抗博弈模型,其特征在于:步骤s1)中,所述的三级节点的分布式网络为边-端-云的三级节点层次互联的分布式网络,并在云端实现防御策略统一部署,引入虚假节点实现蜜罐网络。
3.根据权利要求1所述的一种基于超博弈的算力网络攻防对抗博弈模型,其特征在于:步骤s2)中,所述的子博弈集包括四个可能存在子博弈,分别为:
4.根据权利要求1所述的一种基于超博弈的算力网络攻防对抗博弈模型,其特征在于:步骤s3)中,对于特定攻击策略和防御策略下的攻防收益矩阵,其计算如下:
5.根据权利要求4所述的一种基于超博弈的算力网络攻防对抗博弈模型,其特征在于:步骤s4)中,所述的超博弈预期效用的表达式如下:
6.根据权利要求5所述的一种基于超博弈的算力网络攻防对抗博弈模型,其特征在于:步骤s4)中,所述的超博弈预期效用用于评估当列玩家在所有可用策略中选择一个策略时,行玩家在选择策略i时的预期效用:
7.根据权利要求6所述的一种基于超博弈的算力网络攻防对抗博弈模型,其特征在于:步骤s4)中,基于超博弈范式,行参与者对于列参与者选择策略j的概率表达式如下:
8.根据权利要求7所述的一种基于超博弈的算力网络攻防对抗博弈模型,其特征在于:基于超博弈定义参与者对于可能存在的子博弈的感知,对于策略收益矩阵中的参与者和列参与者,定义在行参与者认知中列参与者在子博弈k中的使用策略i的概率为:
9.根据权利要求8所述的一种基于超博弈的算力网络攻防对抗博弈模型,其特征在于:定义行参与对超博弈的信念,即行参与者认为列参与者选择进行子博弈j的概率为:
10.根据权利要求1所述的一种基于超博弈的算力网络攻防对抗博弈模型,其特征在于:步骤s5)中,防御者策略与攻击者策略将直接带来节点受损状态的变化,其中算力网络节点状态变化如下: