一种用于定价博弈的资源均衡策略优化方法

    技术2025-02-19  47


    本发明涉及智能车联网领域,尤其是涉及一种用于定价博弈的资源均衡策略优化方法。


    背景技术:

    1、在当代社会快速过渡到数字时代的过程中,车联网(iov)技术已经成为这一变革的先锋,重塑了对移动和连接的理解。iov,也被称为智能车联网,通过先进的通信技术将车辆与车辆、道路基础设施、行人和网络服务连接起来。这种网络优化了交通流量,减少了事故,提高了能源效率。它也为司机和乘客提供了前所未有的便利和服务。

    2、在iov中,三个关键参与者发挥着至关重要的作用。1)以智能汽车为主的计算能力需求者需要大量的计算资源来处理自动驾驶和导航的传感器数据。2)计算能力提供商(cpps)包括云服务、数据中心和板载设备,提供处理能力、存储和带宽,以增强车联网功能。3)第三方服务提供商,如数据分析公司和车联网平台提供商,弥合需求方和供应商之间的差距,通过智能解决方案优化资源利用。

    3、智能汽车和移动设备的普及大大提高了对处理能力的需求。这些车辆配备了先进的传感器,如雷达、激光雷达、声纳和gnss,必须处理大量的实时数据。英特尔报告称,一辆自动驾驶汽车每天可以产生大约4000千兆字节的数据,相当于近3000人的数据使用量。数据的激增对现有的通信、存储和计算基础设施构成了挑战。例如,nvidia的自动驾驶系统采用了几tb容量的ssd,由于高分辨率摄像头和深度神经网络需要高达每秒2.5万亿次操作(tops)的处理能力,这些ssd很快就会变得不堪重负。

    4、为了应对这些挑战,算力网络(cpn)利用来自数据中心、网络边缘和移动设备的大量计算资源,将它们集成到一个统一的虚拟网络中,形成一个池,以提高效率和性能。该网络动态分配资源,以减轻孤立计算能力的“孤岛效应”。在cpn中,移动设备和车辆作为算力提供者,增强网络容量。

    5、分布式计算方法使这些设备能够更有效地协同处理数据和执行任务,从而加快数据处理速度,提高系统可靠性,并支持实时决策和高频数据交换。该网络强大地支持高级驾驶辅助系统(adas)、自动驾驶技术和其他智能交通服务。现有技术中存在的问题如下:

    6、(1)市场定价与垄断问题。现行市场定价机制缺乏透明度,由少数大企业主导,导致定价不公平,资源分配效率低下,使中小企业处于不利地位,最终导致市场不稳定。

    7、(2)计算能力移动建模。车联网的动态性和移动性使传统的资源管理复杂化,需要先进的模型来有效地理解和优化移动性,确保计算资源的供需平衡。

    8、(3)动态服务需求影响。车联网服务需求的波动挑战了静态资源分配,需要自适应策略来有效地匹配资源供应和需求的变化。cpp结构的离散性。传统离散系统的状态空间无法及时描述cpp的流体流动性。随着大量移动cpp逐渐加入cpn,cpp的到达间隔变短,到达速率变大,使cpp接近连续流体。


    技术实现思路

    1、本发明的目的在于提供一种用于定价博弈的资源均衡策略优化方法,,提高市场效率和包容性,确保有效分配并减少浪费,提高资源利用率和计算网络的可持续性。

    2、为实现上述目的,本发明提供了一种用于定价博弈的资源均衡策略优化方法,包括

    3、构造计算能力需求方的资源估值,第三方服务提供商的资源利用率,计算能力需求者与第三方服务提供商之间的相互作用形成不完全信息博弈,导致贝叶斯纳什均衡,得到交易价格;

    4、构建流体模型,根据交易价格构造每个潜在的cpp在完成服务后得到的奖励;所述潜在的cpp为实体根据预期收入和意愿决定是否加入资源池并成为计算能力提供商;

    5、根据每个潜在的cpp在完成服务后得到的奖励获得每单位预期效用,根据每单位预期效用分析流体的纳什均衡策略;

    6、根据流体的纳什均衡策略分析单位时间的平均社会收益效用,根据平均社会收益效用获得最大化社会福利;

    7、采用扩散模型求解最大化平均社会福利这一优化问题。

    8、优选的,计算能力需求者的资源估值构造为

    9、d=cmin+cmax-cminξ+(1-ξ)dξ+η,

    10、其中,d计算为d=dn+dc+dd+dt+df,dn,dt,dc,dd,df分别代表传感器数量、传感器类型、算法复杂度、数据量和地图更新频率,ξ∈[0,1]为延迟要求的时间因子,η为精度要求,ξ=1/2,cmin为资源估值最小值,cmax为资源估值最大值。

    11、优选的,第三方服务提供商的资源利用率l定义为

    12、l=lα·lc+lβ·lm+lγ·lw+lδ·lt-1,

    13、其中,lα、lβ、lγ和lδ是反映各指标在整体资源利用率中的相对重要性的权重系数;lc、lm、lw和lt分别表示服务器cpu利用率、内存利用率、网络带宽利用率和服务响应时间。

    14、3.根据权利要求1所述的一种用于定价博弈的资源均衡策略优化方法,其特征在于,交易价格的计算方法为

    15、根据资源估值和资源利用率,在投标策略的相应区间内,以等概率提交不同的投标,即然后,交易价格定义为其中,α根据市场指导规则固定为1/2。

    16、优选的,构建流体模型,根据交易价格构造每个潜在的cpp在完成服务后得到的奖励;

    17、将阈值表示为h,当液位y(t)≤h时,输出速率为当液位y(t)>h时,系统将适当加速工作速率,工作速率将增加到

    18、cpp在正常工作期和休假期之间交替变化,两者独立且指数分布,分别为τ1和τ0,计算能力池的状态由二态连续时间马尔可夫链z(t)记录,计算能力池的等待容量是无限的,记录流体液位的过程y(t)的动力学由以下给出:

    19、

    20、其中,τi,i=0,1,τ0为正常工作时段,τ1为休假模式,(y)+=max(y,0),二元过程{y(t),z(t)}是马尔可夫的,根据交替更新过程,得到z(t)的稳态分布

    21、

    22、每个潜在的cpp在完成服务后得到的奖励为

    23、r(p)=β*p-γ*p2+σ

    24、系数β,γ和σ是正的,封装线性二次函数所描述的递减收益;c为每个cpp每时间单位的能量成本。

    25、优选的,根据每个潜在的cpp在完成服务后得到的奖励获得每单位预期效用,包括

    26、当cpp选择进入系统时,每单位预期效用为:

    27、u(x,i)=r(p)-c*e(s(x,i))

    28、式中,sx,i,表示观察到液位为x,系统状态为i时,流体在系统中的停留时间,为保证流体在液位为0时到达并进入系统,规定

    29、当移动设备到达时观察到系统处于状态(y(t),z(t))=(x,i)时,预期效用为u(x,i)=r(p)-c*e(s(x,i));当u(x,i)>0时,移动设备倾向于严格同意成为cpp;当u(x,i)<0时,移动设备倾向于严格拒绝成为cpp。

    30、优选的,根据每单位预期效用分析流体的纳什均衡策略,包括

    31、在完全可见情况下,具有阈值控制策略的流体排队系统的纳什均衡策略由公式给出:

    32、

    33、式中,(xe(0),xe(1))为流体水平小于等于阈值时的纳什均衡阈值,(ye(0),ye(1))为流体水平大于阈值时的纳什均衡阈值;

    34、当t时刻cpp到达时,观察(y(t),z(t)),当x≤b时若y(t)<xe(z(t))加入,当x>b时若y(t)>xe(z(t))退出;

    35、在相同x下,流体在快模式下的等待时间小于慢模式下的等待时间,即e(s(x,1))<e(s(x,0));同时,得到0<xe(0)<xe(1)和0<ye(0)<ye(1),进一步,得到xe(0)<ye(0),xe(1)<ye(1)。

    36、优选的,根据流体的止步均衡策略分析单位时间的平均社会收益效用,根据平均社会收益效用获得最大化社会福利,包括

    37、单位时间的平均社会收益效用函数为:

    38、b((xe(0),xe(0)),(ye(0),ye(1)))=λe*r-c*e(x),

    39、其中,λe是流体的有效到达率,e(x)是平均液位,即计算池中的平均存储量;平均社会收益是指当到达算力资源池的所有cpp均遵守个体均衡策略时,算力资源池的稳态液位对应的整体系统收益;

    40、在动态调整流体策略,以最大限度地提高社会福利

    41、

    42、优选的,计算池中的平均存储量,具体情形如下:情形1:

    43、

    44、情形2:

    45、

    46、情形3:

    47、

    48、情形4:

    49、

    50、

    51、情形5:

    52、

    53、其中

    54、优选的,采用扩散模型求解最大化平均社会福利这一优化问题,包括以下步骤:

    55、去噪:将环境状态表示为一个向量e=eλ,ec,eh包含做出决策所需的所有环境信息,其中λ为流体到达率、c为系统内单位时间能量成本和h为阈值;

    56、将flux的流体策略定义为对于给定的环境状态e,首先随机生成一个高斯噪声作为一种流体策略,其中,n表示去噪过程的总步数,0表示高斯分布的均值向量,i表示协方差矩阵;

    57、然后,通过扩散模型的多步去噪过程,基于当前噪声水平与给定环境状态e的流体策略ci,预测下一步的流体策略ci-1,直到从高斯噪声中提取和细化得到最终流体策略设计c0;

    58、优化:在每个去噪步骤之后,评估当前流体策略的质量,即其预期累积奖励,根据评估结果,调整扩散模型参数,使流体策略设计的期望累积奖励与实际奖励之间的差值最小;

    59、重复上述去噪和优化过程,直到算法收敛到优化目标最大化的契约设计。

    60、优选的,所述评估当前流体策略的质量,具体包括

    61、采用双q-学习技术,通过两个独立训练的q网络来估计e,c0的环境-流体策略的预期累积奖励,双q学习通过使用两个q值中较小的一个来估计合同的预期回报,根据双q学习评价结果,调整扩散模型参数,使流体策略设计的期望累积奖励与实际奖励之间的差值最小。

    62、因此,本发明采用上述的一种用于定价博弈的资源均衡策略优化方法,技术效果如下:

    63、(1)引入定价博弈框架,促进公平和透明的计算资源交易,通过鼓励大小实体参与,提高市场效率和包容性。

    64、(2)利用流体模型的原理,物联网架构可以感知并动态响应网络内资源和实体的移动性,确保有效分配并减少浪费。

    65、(3)使用扩散算法实现动态资源分配策略,以适应实时需求变化,提高资源利用率和计算网络的可持续性。


    技术特征:

    1.一种用于定价博弈的资源均衡策略优化方法,其特征在于,包括

    2.根据权利要求1所述的一种用于定价博弈的资源均衡策略优化方法,其特征在于,计算能力需求者的资源估值构造为

    3.根据权利要求1所述的一种用于定价博弈的资源均衡策略优化方法,其特征在于,第三方服务提供商的资源利用率l定义为

    4.根据权利要求1所述的一种用于定价博弈的资源均衡策略优化方法,其特征在于,构建流体模型,根据交易价格构造每个潜在的cpp在完成服务后得到的奖励;

    5.根据权利要求1所述的一种用于定价博弈的资源均衡策略优化方法,其特征在于,根据每个潜在的cpp在完成服务后得到的奖励获得每单位预期效用,包括

    6.根据权利要求5所述的一种用于定价博弈的资源均衡策略优化方法,其特征在于,根据每单位预期效用分析流体的纳什均衡策略,包括

    7.根据权利要求1所述的一种用于定价博弈的资源均衡策略优化方法,其特征在于,根据流体的止步均衡策略分析单位时间的平均社会收益效用,根据平均社会收益效用获得最大化社会福利,包括

    8.根据权利要求7所述的一种用于定价博弈的资源均衡策略优化方法,其特征在于,计算池中的平均存储量,具体情形如下:

    9.根据权利要求8所述的一种用于定价博弈的资源均衡策略优化方法,其特征在于,采用扩散模型求解最大化平均社会福利这一优化问题,包括以下步骤:

    10.根据权利要求9所述的一种用于定价博弈的资源均衡策略优化方法,其特征在于,所述评估当前流体策略的质量,具体包括


    技术总结
    本发明提供了一种用于定价博弈的资源均衡策略优化方法,包括计算能力需求者和第三方服务提供商,计算能力需求者根据自身需求进行资源估值,第三方服务提供商根据资源的权重估算资源利用率,基于资源估值和资源利用率进行定价博弈,第三方服务提供商为计算力需求者提供作为代理管理计算能力资源池,资源池包括实体为潜在的CPP。本发明采用上述的一种用于定价博弈的资源均衡策略优化方法,提高市场效率和包容性,确保有效分配并减少浪费,提高资源利用率和计算网络的可持续性。

    技术研发人员:仇超,曹恬恬,刘泽军,侯晨璇,王晓飞
    受保护的技术使用者:天津大学
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-26757.html

    最新回复(0)