一种基于信号博弈的多阶段网络防御方法及系统与流程

    技术2025-02-05  47


    本发明涉及网络安全防御,具体涉及一种基于信号博弈的多阶段网络防御方法及系统。


    背景技术:

    1、当前,随着网络攻击手段的不断升级和多样化,网络安全防护面临严峻挑战,传统的网络防御方法多以被动防御为主,缺乏主动性和灵活性,难以有效应对复杂多变的攻击行为,随着攻击者使用越来越先进的技术手段,现有防御措施的效果逐渐减弱。为了提高网络防御的有效性,研究人员开始关注基于博弈论的防御策略,其中,信号博弈被认为是一种有潜力的方法。

    2、信号博弈是一种在不对称信息环境下,双方通过释放和解读信号进行策略选择和决策的博弈模型。防御者通过释放各种欺骗性信号,诱导攻击者做出错误判断,从而保护网络安全,与此同时,攻击者则通过探测和分析这些信号,更新其对防御者策略的判断,并选择相应的攻击策略,这种基于信号博弈的方法可以在一定程度上提高防御的主动性和灵活性,但也面临着一系列技术挑战。目前,已有的一些研究探索了在网络防御中应用博弈论的方法,但大多集中在单阶段博弈上,缺乏对多阶段动态博弈的深入研究,此外,现有方法在实际应用中常常忽略了信号特征的复杂性和攻击者的学习能力,使得防御效果难以持久。


    技术实现思路

    1、本发明中提供了一种基于信号博弈的多阶段网络防御方法及系统,从而有效解决背景技术中所指出的问题。

    2、为了达到上述目的,本发明所采用的技术方案是:

    3、一种基于信号博弈的多阶段网络防御方法,所述方法包括:

    4、防御者释放多种信号欺骗攻击者,攻击者通过探测形成初始先验判断;

    5、攻击者根据防御信号更新后验概率,并结合机器学习算法分析信号特征和历史攻击数据,确定最优攻击策略;

    6、防御者实时监控网络状态,通过基于图神经网络的拓扑结构分析和多层次博弈决策模型,优化信号释放策略,动态调整信号频率和类型;

    7、攻击者和防御者利用双重优化算法优化各自的策略,且防御者利用增强学习算法实时调整博弈策略;

    8、攻击者结合多阶段博弈中的收益和损失函数,利用动态博弈理论和模糊逻辑规则,更新第二后验概率;

    9、循环迭代并判断是否满足终止条件,分析结果并调整策略,结束或继续下一轮博弈,在每一轮博弈结束后,博弈双方利用复杂网络分析方法和非线性动态系统模型,对博弈过程进行评估和调整,优化下一轮博弈的策略。

    10、进一步地,所述后验概率计算过程采用基于蒙特卡洛模拟的求解方法,包括:

    11、设定初始信号策略集合和攻击者策略集合;

    12、通过随机采样生成若干的信号和攻击策略的组合,所述组合模拟实际博弈中的各种可能情况;

    13、对每个样本,根据其对应的信号策略和攻击策略,计算攻击者和防御者的收益函数;

    14、根据生成的所述样本和计算的所述收益函数,使用贝叶斯公式更新攻击者和防御者的后验概率分布。

    15、进一步地,所述后验概率通过精炼叶贝斯纳什均衡求解,所述精炼贝叶斯纳什均衡满足条件,包括:

    16、

    17、其中,a*(m)为给定信号策略m的的情况下,攻击者选择的最优攻击策略,为在攻击策略集合sa中寻找使得下面表达式最大化的ah,下面的表达式是对所有防御者类型ti进行加权求和,权重为即在给定信号m下防御者类型ti的后验概率,ua(m,ah,ti)表示在信号m、攻击策略ah和防御者类型ti下的攻击者的收益,m*(t)为给定信号策略t的的情况下,攻击者选择的最优攻击策略,为在攻击策略集合m中寻找使得下面表达式最大化的mj,下面的表达式是对所有防御者类型ah进行加权求和,权重为pd(ah),即攻击者选择攻击策略ah的概率,ua(m,ah,ti)表示在信号mj、攻击策略ah和防御者类型t下防御者的收益。

    18、进一步地,在每个博弈开始阶段,攻击者考虑防御者类型误判的情况,并计算不同类型误判的概率,得到误判率矩阵,所述误判率矩阵为:

    19、

    20、其中,ε为误判率,k为博弈的阶段数,εij为攻击者将防御者的真实类型误判的概率。

    21、进一步地,攻击者在防御者类型误判的情况下采取不同攻击策略带来的损失用损失矩阵表示,所述损失矩阵为:

    22、

    23、其中,λ(tr,ax)为当真是的防御者类型为tr时,攻击者选择攻击策略ax所导致的损失,t1、t2…tn为所有可能的防御者类型,a1、a2…an为所有可能的攻击策略。

    24、进一步地,基于攻击者将防御者类型误判为不同类型,并采取不同策略时所产生的风险和收益计算攻击者的风险收益,公式为:

    25、

    26、其中,rr(ti,ah)表示当攻击者将防御者误判为ti并才去攻击策略ah时的风险收益,λ(ti,ah)表示当防御者类型为ti且攻击者采取攻击策略ah时的损失,ε(ti,t9)表示攻击者将防御者类型误判为ti而实际类型为,tg的概率,n为防御者类型的数量。

    27、进一步地,双方博弈过程采用最优化方法求解是使得自身收益最大化的过程,当防御者采取纯策略时,攻击者每个策略的收益为ua(m,a)计算方式如下:

    28、

    29、其中,ua(m,a)为攻击者在采取策略a的情况下对于防御者的信号选择策略m的期望收益,p(ti|m)为在防御者选择信号策略m的情况下,攻击者对于防御者类型ti的后验概率,ua(a,m,ti)为在攻击者采取策略a、防御者选择信号策略m且防御者类型为ti的情况下,攻击者的收益。

    30、进一步地,防御者纯策略时,攻击者的每个策略的期望收益形成攻击者的期望收益矩阵ua,表达式为:

    31、

    32、其中,ua(mi,aj)为在防御者选择信号策略mi,攻击者选择策略aj的情况下,攻击者的期望收益。

    33、进一步地,所述复杂网络分析方法,包括:

    34、将博弈过程中的元素表示为网络节点,所述网络节点之间的关系表示为边,构建复杂网络模型,所述元素包括但不限于防御信号、攻击策略、收益;

    35、计算网络的基本指标,分析网络的结构特性,并计算网络中心性指标,识别博弈过程中关键节点和重要策略;

    36、利用社区发现算法,识别博弈网络中的社区结构,分析不同策略和信号之间的关系。

    37、一种基于信号博弈的多阶段网络防御系统,所述系统包括:

    38、初始先验判断形成模块,防御者释放多种信号欺骗攻击者,攻击者通过探测形成初始先验判断;

    39、最优攻击策略确定模块,攻击者根据防御信号更新后验概率,并结合机器学习算法分析信号特征和历史攻击数据,确定最优攻击策略,并确定最优攻击策略;

    40、释放策略优化调整模块,防御者实时监控网络状态,通过基于图神经网络的拓扑结构分析和多层次博弈决策模型,优化信号释放策略,动态调整信号频率和类型;

    41、双方策略优化模块,攻击者和防御者利用双重优化算法优化各自的策略,且防御者利用增强学习算法实时调整博弈策略;

    42、第二后验概率更新模块,攻击者结合多阶段博弈中的收益和损失函数,利用动态博弈理论和模糊逻辑规则,更新第二后验概率;

    43、博弈终止判断优化模块,循环迭代并判断是否满足终止条件,分析结果并调整策略,结束或继续下一轮博弈,在每一轮博弈结束后,博弈双方利用复杂网络分析方法和非线性动态系统模型,对博弈过程进行评估和调整,优化下一轮博弈的策略。

    44、通过本发明的技术方案,可实现以下技术效果:

    45、通过本发明,实现了防御策略的动态优化和攻击策略的有效应对,提升了网络防御的主动性和灵活性,并提高防御系统的整体鲁棒性和有效性。


    技术特征:

    1.一种基于信号博弈的多阶段网络防御方法,其特征在于,包括:

    2.根据权利要求1所述的基于信号博弈的多阶段网络防御方法,其特征在于,所述后验概率计算过程采用基于蒙特卡洛模拟的求解方法,包括:

    3.根据权利要求1所述的基于信号博弈的多阶段网络防御方法,其特征在于,所述后验概率通过精炼叶贝斯纳什均衡求解,所述精炼贝叶斯纳什均衡满足条件,包括:

    4.根据权利要求1所述的基于信号博弈的多阶段网络防御方法,其特征在于,在每个博弈开始阶段,攻击者考虑防御者类型误判的情况,并计算不同类型误判的概率,得到误判率矩阵,所述误判率矩阵为:

    5.根据权利要求1所述的基于信号博弈的多阶段网络防御方法,其特征在于,攻击者在防御者类型误判的情况下采取不同攻击策略带来的损失用损失矩阵表示,所述损失矩阵为:

    6.根据权利要求5所述的基于信号博弈的多阶段网络防御方法,其特征在于,基于攻击者将防御者类型误判为不同类型,并采取不同策略时所产生的风险和收益计算攻击者的风险收益,公式为:

    7.根据权利要求1所述的基于信号博弈的多阶段网络防御方法,其特征在于,双方博弈过程采用最优化方法求解是使得自身收益最大化的过程,当防御者采取纯策略时,攻击者每个策略的收益为ua(m,a)计算方式如下:

    8.根据权利要求1所述的基于信号博弈的多阶段网络防御方法,其特征在于,防御者纯策略时,攻击者的每个策略的期望收益形成攻击者的期望收益矩阵ua,表达式为:

    9.根据权利要求8所述的基于信号博弈的多阶段网络防御方法,其特征在于,所述复杂网络分析方法,包括:

    10.一种基于信号博弈的多阶段网络防御系统,其特征在于,所述系统包括:


    技术总结
    本发明涉及网络安全防御技术领域,具体涉及一种基于信号博弈的多阶段网络防御方法及系统,方法包括:防御者释放多种信号欺骗攻击者,攻击者通过探测形成初始先验判断;攻击者根据防御信号更新后验概率,确定最优攻击策略;防御者实时监控网络状态,优化信号释放策略,动态调整信号频率和类型;攻击者和防御者利用双重优化算法优化各自的策略,且防御者利用增强学习算法实时调整博弈策略;攻击者结合多阶段博弈中的收益和损失函数,更新第二后验概率;循环迭代并判断是否满足终止条件,分析结果并调整策略,结束或继续下一轮博弈。通过本发明,实现了防御策略的动态优化和攻击策略的有效应对,提升了网络防御的主动性和灵活性,并提高防御系统的整体鲁棒性和有效性。

    技术研发人员:李岩,王梓莹,朱道华,黄伟,顾智敏,冒佳明,庄岭,郭静,姜海涛,孙云晓,赵新冬,黄哲忱
    受保护的技术使用者:国网江苏省电力有限公司电力科学研究院
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-25982.html

    最新回复(0)