本发明涉及电力市场交易,尤其涉及一种跨区域省间现货分段量价申报优化方法及系统。
背景技术:
1、当前我国呈现出资源禀赋和用电负荷逆向分布的特征,用电负荷集中于我国的东部和中部地区,而煤炭、风光水等资源分布在我国的西部和北部地区;随着全国统一电力市场建设的不断深入,需充分利用省间通道剩余输电能力进行跨省跨区的电力余缺互济,缓解各省内部电力供需不平衡。我国省间现货市场在不断完善下,已形成多电源交易品种、跨区跨省的省间电力现货交易,在以省级电网为主要购电主体的背景下,需结合省间现货市场出清机制进行购电主体参与省间现货市场的购电方法及系统的制定。
2、目前,既有的购电方法研究集中于现货时间尺度,未考虑中长期合约电量因素,导致了申报策略时序衔接不足,购电方案仅考虑在现货尺度上最优,未能形成多时间尺度的最优配置;此外,对于多购电主体之间的通道情况,目前研究仅将跨区通道视为购售主体之间的路径,忽略了区域内通道与跨区通道的组合对成本的影响,缺少了对主要省份及路径组合的筛选与博弈情况分析,影响各主体购电成本的计算,导致对量价申报结果的计算不够精确,降低了各购电主体的经济收益,影响整体的经济性。因此,对于跨区跨省的省间电力现货交易量价申报方法还有待优化。
技术实现思路
1、为解决现有技术中存在的不足,本发明提供一种跨区域省间现货分段量价申报优化方法及系统,充分考虑输电通道折算及损耗、中长期合约电量分解、多主体博弈等关键因素,进一步优化省间现货量价申报策略,实现电力资源的优化配置。
2、本发明采用如下的技术方案。
3、第一方面,本发明提供一种跨区域省间现货分段量价申报优化方法,方法包括:
4、获取购电主体省间及省内的基础数据;
5、根据所述基础数据对省间现货购电路径进行优化,得到各购电主体与各售电主体之间一对一的路径组合网络结构;
6、基于所述路径组合网络结构,构建以购电主体在省间-省内两级市场中总购电成本最小为目标的上层模型,以及以社会福利最大为目标的省间现货市场出清下层模型,得到多主体省间现货申报双层模型;
7、基于所述基础数据及路径组合网络结构,构建所述双层模型的约束条件;
8、结合所述约束条件对所述双层模型进行求解,获得购电主体的省间现货申报策略。
9、可选的,所获取的省间基础数据包括购电主体省间现货各时段历史申报量价、各时段历史出清量价、各时段通道的预测剩余容量、通道的输电费用及网损率;
10、所获取的省内基础数据包括购电主体各时段省内用电需求、省内市场的预测购电价格、年度中长期合约电量、各月用电量占年度用电量的比例、各月典型分时曲线各时段用电量占比及省内各电源出力运行参数。
11、可选的,根据所述基础数据对省间现货购电路径进行优化的步骤包括:
12、获取各购电主体与各售电主体之间的初始通道;
13、基于初始通道中各通道的输电费用,分别计算各购电主体与其对应的各售电主体之间路径组合的总输电费用;
14、以总输电费用最小的路径组合作为每两个一对一的购电主体与售电主体之间的单一路径,其表达式如下:
15、
16、式中,表示购电主体k与售电主体j之间单一路径的总输电费用;表示购电主体k与售电主体j之间的第l条通道的输电费用;l表示购电主体k与售电主体j之间交易路径上的共用通道序号;j=1,2,…,j;k=1,2,…,k;j和k分别表示购电主体和售电主体的总个数;r表示购电主体k至售电主体j之间的通道总数。
17、可选的,所述上层模型的目标函数的表达式如下:
18、
19、式中,ck表示购电主体k在省间-省内两级市场中的总购电成本;表示购电主体k在t时段中第n类电源的出力,n表示电源的种类数;t表示时段总数;为购电主体k在省内市场t时段的预测购电价格;表示购电主体k在省间现货市场t时段的购电电量;表示购电主体k在省间现货市场t时段的出清价格。
20、可选的,所述下层模型的目标函数的表达式如下:
21、
22、式中,为售电主体j在t时段的报价;为在t时段购电主体k与售电主体j之间单一路径上的传输电量;表示购电主体k与售电主体j之间单一路径的总输电费用;表示购电主体k在省间现货市场t时段的购电电量;表示购电主体k在t时段的报价。
23、可选的,所述售电主体j在t时段的报价的计算公式如下:
24、
25、式中,为t时段售售电主体j在报价段d中的最大值;为t时段售电主体j对购电主体k的出清价格;为t时段购电主体k报价的最小值;表示购电主体k与售电主体j之间单一路径的总输电费用。
26、可选的,所述购电主体k在t时段的报价是基于中长期合约电量分解确定的,具体包括以下步骤:
27、计及购电主体在年度、月度、日分时时间尺度上的用电特性,将购电主体k的年度中长期合约电量分解到t时段的电量的公式如下:
28、
29、式中,表示购电主体k的年度中长期合约电量;m表示t时段所处的月份;d为第m月的总天数;αm表示第m月电量占年度用电量的比例;βm,t表示第m月的典型分时曲线中t时段的用电量占比;
30、基于分解得到的t时段电量计算购电主体k在t时点的电力缺口为
31、
32、式中,nk,t表示通购电主体k在t时段的电力需求;
33、根据电力缺口为与价格的对应分段进行申报,得到购电主体k在t时段的报价的表达式如下:
34、
35、式中,o1、o2和o3分别表示第一层报价值、第二层报价值和第三层报价值,o1<o2<o3;χ1、χ2和χ3分别表示第一紧缺程度阈值、第二紧缺程度阈值和第三紧缺程度阈值,χ1<χ2<χ3;当电力缺口为小于0时,购电主体k不进行购电,即报价为0。
36、可选的,所述双层模型的约束条件包括供需平衡约束、省内电源发电上下限约束、省内电源发电爬坡约束、省内备用容量约束、省间联络线爬坡约束、省间现货出清价格与申报价格约束、省间联络线平衡约束、售电主体售电约束及购电主体购电约束。
37、可选的,所述省间联络线平衡约束的表达式为:
38、
39、式中,表示在t时段售电主体j至购电主体k省的外送电力;ρk,j表示购电主体k与售电主体j之间单一路径的网损率,其计算公式如下:
40、
41、式中,ρl表示第l条通道的网损率;l表示购电主体k与售电主体j之间单一路径上的总通道数。
42、可选的,所述售电主体售电约束及购电主体购电约束的表达式分别为:
43、
44、式中,表示购电主体k之与售电主体j之间单一路径上的通道剩余容量上限值,其计算公式如下:
45、
46、式中,表示第l条通道的预测剩余容量;l=1,2,…,l;l表示购电主体k与售电主体j之间单一路径上的总通道数。
47、可选的,对所述双层模型进行求解采用的算法为基于多智能体与环境交互博弈的强化学习算法;
48、所述算法包括:以具有自主学习能力的智能体k表示购电主体k来模拟上层模型各购电主体的申报策略,设定智能体k的学习环境为下层模型省间现货市场出清过程,通过智能体k在环境的动作与策略迭代,逐渐学习其最佳策略,最后输出购电主体的省间现货申报策略。
49、可选的,采用基于多智能体与环境交互博弈的强化学习算法对所述双层模型进行求解的步骤具体包括:
50、步骤1:基于输入的历史出清量价格生成初始智能体学习要素
51、其中,表示智能体k在t时段的状态,和分别表示购电主体k在t-1时段的历史省间现货购电量和出清均价;
52、表示智能体k在t时段的报价动作,的初始动作空间为表示设定的省间现货报价上限值;
53、表示智能体k在t时段的策略,即表示动作空间中选择各报价动作的概率值;
54、步骤2:通过蒙特卡洛方法在当前的动作空间中进行报价动作抽样,并按照设定的规则逐步缩小报价动作空间的上限值,以筛选出当前满足条件的报价动作
55、步骤3:通过下层模型学习环境接受上层模型智能体k的当前状态及报价动作进行学习优化,并设置智能体k与学习环境交互所需的购电成本负值作为奖励;
56、步骤4:在当前状态下,通过折算因子迭代相乘表示当前所有奖励的折算之和,以得到当前的累计回报rk,t,其计算公式如下:
57、
58、式中,γi表示当前第i次的奖励折算因子;表示当前第i次筛选出来的报价动作对应的奖励;i表示当前轮智能体k与学习环境交互的次数;
59、步骤5:获取学习环境中多智能体在当前第i轮博弈后的出清结果,并结合当前的累计回报rk,t,i对智能体k进行状态更新,更新智能体k在当前i次报价动作和状态下的策略期望值如下:
60、
61、式中,表示智能体k在第i-1次筛选出来的报价动作和第i-1次下状态的策略期望;v表示学习率;
62、步骤6:判断当前状态下智能体k的策略期望值是否满足设定的终止条件,若不满足,则令i=i+1,并更新智能体当前策略对应各报价动作的概率值后,返回执行步骤1;若满足,则生成均衡状态下的智能体策略,即得到购电主体的省间现货申报策略。
63、可选的,所述步骤2具体包括:
64、步骤2.1:通过蒙特卡洛方法在当前的动作空间中进行报价动作抽样;
65、步骤2.2:若当前的动作空间为时,则将动作空间更新为[0,o3]后,判断抽样动作是否小于o3;若否,则返回执行步骤2.1;若是,则输出当前的抽样动作
66、若当前的动作空间为[0,o3]时,则将动作空间更新为[0,o2]后,判断抽样动作是否小于o2;若否,则返回执行步骤2.1;若是,则输出当前的抽样动作
67、若当前的动作空间为[0,o2]时,则将动作空间更新为[0,o1]后,判断抽样动作是否小于o1;若否,则返回执行步骤2.1;若是,则输出当前的抽样动作
68、若当前的动作空间为[0,o1]时,则直接输出当前的抽样动作
69、可选的,所述步骤6中判断当前状态下智能体k的策略期望值是否满足设定的终止条件的表达式如下:
70、
71、式中,ε为收敛精度。
72、可选的,所述步骤6中更新智能体当前策略对应各报价动作的概率值的表达式如下:
73、
74、其中,表示前i次动作后智能体k在t时段对应动作的平均概率,表示状态出现的次数,表示前i-1次动作后智能体k在t时段对应动作的平均概率。
75、第二方面,本发明提供一种跨区域省间现货分段量价申报优化系统,运行本发明第一方面中任一项所述方法的步骤,系统包括:
76、获取数据模块,用于获取购电主体省间及省内的基础数据;
77、优化路径组合模块,用于根据所述基础数据对省间现货购电路径进行优化,得到各购电主体与各售电主体之间一对一的路径组合网络结构;
78、构建双层模型模块,用于基于所述路径组合网络结构,构建以购电主体在省间-省内两级市场中总购电成本最小为目标的上层模型,以及以社会福利最大为目标的省间现货市场出清下层模型,得到多主体省间现货申报双层模型;
79、构建约束条件模块,用于基于所述基础数据及路径组合网络结构,构建所述双层模型的约束条件;
80、求解双层模型模块,用于结合所述约束条件对所述双层模型进行求解,获得购电主体的省间现货申报策略。
81、第三方面,本发明提供一种终端,包括处理器及存储介质;
82、所述存储介质用于存储指令;
83、所述处理器用于根据所述指令进行操作以执行本发明第一方面中任一项所述方法的步骤。
84、第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第一方面中任一项所述方法的步骤。
85、本发明的有益效果在于,与现有技术相比,
86、(1)针对现有方法忽略了区域内通道与跨区通道的组合对成本的影响,本发明通过对省间现货购电路径进行优化,搭建了关于购电主体参与省间现货市场购电的路径组合网络结构,可以更加有效地描述影响购电主体的主要购电来源及对应路径组合,降低了输电费用,并由此推断售电主体省份报价,使得省间电力资源达到最优配置效果;
87、(2)本发明以购电主体的总购电成本最小为目标,依据省间现货市场实际出清规则,以中长期分解电量作为边界,将省内预出清结果纳入考虑,构建上层为省内市场购电,下层为省间市场出清的双层模型,引入缺口判断报价大小,方法兼顾的因素更为全面,能够充分考虑多购电主体在电力市场上多时间尺度、多空间尺度影响因素及博弈关系,提高了对量价申报结果的计算的精确度,更加符合实际市场规则,有效降低低谷时段购电成本,提高各购电主体的经济性,本发明优化方法更具有实用价值,适合推广运用。
88、(3)已有的多智能体强化学习方法对多市场主体博弈情况进行模拟时,多集中于对省内市场交易研究,缺乏对省间市场环境与省间报价约束的适应性处理,导致求解方法难以准确处理省间现货购电约束,不适合新市场环境。而本发明利用多智能体强化学习技术刻画多个省间现货购电主体的历史状态及报价动作,相比于已有的多智能体强化学习算法通过设置罚函数、对边际成本分段的方式处理约束条件,本发明利用报价约束边界逐步缩小报价动作空间,能够更精准地模拟省间市场购电情形,实现了高速、准确的计算和优化,符合省间现货购电实际量价申报约束,提高了算法在智能体动作上对省间现货购电的适用性。
1.一种跨区域省间现货分段量价申报优化方法,其特征在于,方法包括:
2.根据权利要求1所述的跨区域省间现货分段量价申报优化方法,其特征在于,
3.根据权利要求1或2所述的跨区域省间现货分段量价申报优化方法,其特征在于,根据所述基础数据对省间现货购电路径进行优化的步骤包括:
4.根据权利要求3所述的跨区域省间现货分段量价申报优化方法,其特征在于,所述上层模型的目标函数的表达式如下:
5.根据权利要求4所述的跨区域省间现货分段量价申报优化方法,其特征在于,所述下层模型的目标函数的表达式如下:
6.根据权利要求5所述的跨区域省间现货分段量价申报优化方法,其特征在于,所述售电主体j在t时段的报价的计算公式如下:
7.根据权利要求5所述的跨区域省间现货分段量价申报优化方法,其特征在于,所述购电主体k在t时段的报价是基于中长期合约电量分解确定的,具体包括以下步骤:
8.根据权利要求5所述的跨区域省间现货分段量价申报优化方法,其特征在于,所述双层模型的约束条件包括供需平衡约束、省内电源发电上下限约束、省内电源发电爬坡约束、省内备用容量约束、省间联络线爬坡约束、省间现货出清价格与申报价格约束、省间联络线平衡约束、售电主体售电约束及购电主体购电约束。
9.根据权利要求8所述的跨区域省间现货分段量价申报优化方法,其特征在于,所述省间联络线平衡约束的表达式为:
10.根据权利要求8所述的跨区域省间现货分段量价申报优化方法,其特征在于,所述售电主体售电约束及购电主体购电约束的表达式分别为:
11.根据权利要求5所述的跨区域省间现货分段量价申报优化方法,其特征在于,对所述双层模型进行求解采用的算法为基于多智能体与环境交互博弈的强化学习算法;
12.根据权利要求11所述的跨区域省间现货分段量价申报优化方法,其特征在于,采用基于多智能体与环境交互博弈的强化学习算法对所述双层模型进行求解的步骤具体包括:
13.根据权利要求12所述的跨区域省间现货分段量价申报优化方法,其特征在于,所述步骤2具体包括:
14.根据权利要求12所述的跨区域省间现货分段量价申报优化方法,其特征在于,所述步骤6中判断当前状态下智能体k的策略期望值是否满足设定的终止条件的表达式如下:
15.根据权利要求12所述的跨区域省间现货分段量价申报优化方法,其特征在于,所述步骤6中更新智能体当前策略对应各报价动作的概率值的表达式如下:
16.一种跨区域省间现货分段量价申报优化系统,运行如权利要求1-15任一项权利要求所述的跨区域省间现货分段量价申报优化方法,其特征在于,系统包括:
17.一种终端,包括处理器及存储介质;其特征在于:
18.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-15任一项所述方法的步骤。