本发明属于电动汽车充放电调度,特别是一种基于深度强化学习的大规模电动汽车充换电负荷优化调度方法。
背景技术:
1、随着全球经济的发展,化石能源逐渐枯竭以及二氧化碳等温室气体排放量不断增加,交通和能源领域作为主要的碳排放源,进一步导致了全球变暖这一全球性气候。在此背景下,电动汽车在加强建设绿色低碳、高质量可持续发展的现代电力系统显得尤为重要。但随着电动汽车保有量的不断增多,对电力系统的安全稳定运行产生了一系列消极影响,尽管分时电价策略已经实施,一定程度上改善了电动汽车无序充电所产生的影响,但易产生新的负荷高峰。另外,电动汽车作为重要的灵活性可调资源,其在实际应用过程中也面临着一些重要问题。
技术实现思路
1、本发明的目的在于针对现有技术存在的问题,提供一种基于深度强化学习的大规模电动汽车充换电负荷优化调度策略。
2、实现本发明目的的技术解决方案为:一方面,提供了一种基于深度强化学习的大规模电动汽车充换电负荷优化调度方法,所述方法包括以下步骤:
3、步骤1,根据用户的行为特征,构建电动汽车可调节识别模型;
4、步骤2,进行不可调节电动汽车负荷与可调节电动汽车负荷建模,并基于此构建不同场景下的充电站优化调度模型;
5、步骤3,构建不同场景下的换电站模型,并构建不同场景下的换电站优化调度模型;
6、步骤4,利用强化学习算法求解步骤2和步骤3的模型,得到最终的不同场景下的充电站优化调度模型和换电站优化调度模型;
7、步骤5,针对待优化的电动汽车用户,基于步骤1的模型进行可调节性识别,之后基于步骤4得到的模型进行充换电负荷优化调度。
8、另一方面,提供了一种基于深度强化学习的大规模电动汽车充换电负荷优化调度系统,所述系统包括:
9、第一模块,用于根据用户的行为特征,构建电动汽车可调节识别模型;
10、第二模块,用于进行不可调节电动汽车负荷与可调节电动汽车负荷建模,并基于此构建不同场景下的充电站优化调度模型;
11、第三模块,用于构建不同场景下的换电站模型,并构建不同场景下的换电站优化调度模型;
12、第四模块,用于利用强化学习算法求解第二模块和第三模块的模型,得到最终的不同场景下的充电站优化调度模型和换电站优化调度模型;
13、第五模块,用于针对待优化的电动汽车用户,基于第一模块的模型进行可调节性识别,之后基于第四模块得到的模型进行充换电负荷优化调度。
14、另一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述基于深度强化学习的大规模电动汽车充换电负荷优化调度方法。
15、另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于深度强化学习的大规模电动汽车充换电负荷优化调度方法。
16、本发明与现有技术相比,其显著优点:
17、(1)本发明的方法考虑了用户的家庭经济情况等因素对分时电价的响应程度、充电排队时间等多种影响电动汽车用户负荷的因素,提高了对用户的行为特征的预测准确性,利于提高充电效率和系统运行稳定性。
18、(2)本发明将电动汽车充电负荷分为可调节负荷和不可调节负荷,并通过聚类分析和svm算法来识别负荷的可调性和不可调性,有助于对不同的负荷类型做出相应的调度安排,从而帮助减少电网负荷波动,降低电网运行风险,增强电网的稳定性和可靠性,利于电力系统进行灵活调度和管理,提升系统的响应速度和灵活性,以适应复杂多变的电力市场环境。
19、(3)本发明考虑并提出了充电站、换电站以及三种典型场景下的优化调度,适用于大规模电动汽车的充换电,实现充换电站的智能协调调度。
20、(4)本发明可以适用于电动汽车充放电优化调度的过程中,具有一定的理论价值和工程价值。
21、下面结合附图对本发明作进一步详细描述。
1.一种基于深度强化学习的大规模电动汽车充换电负荷优化调度方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的基于深度强化学习的大规模电动汽车充换电负荷优化调度方法,其特征在于,步骤1所述根据用户的行为特征,构建电动汽车可调节识别模型,具体包括:
3.根据权利要求2所述的基于深度强化学习的大规模电动汽车充换电负荷优化调度方法,其特征在于,步骤1-1中电动汽车充电可调性特征元组中特征参数计算公式如下:
4.根据权利要求2所述的基于深度强化学习的大规模电动汽车充换电负荷优化调度方法,其特征在于,步骤1-3具体包括:
5.根据权利要求2所述的基于深度强化学习的大规模电动汽车充换电负荷优化调度方法,其特征在于,步骤1-5中svm模型为:
6.根据权利要求1所述的基于深度强化学习的大规模电动汽车充换电负荷优化调度方法,其特征在于,步骤2具体包括:
7.根据权利要求6所述的基于深度强化学习的大规模电动汽车充换电负荷优化调度方法,其特征在于,步骤3具体包括:
8.基于权利要求1至7任意一项所述方法的基于深度强化学习的大规模电动汽车充换电负荷优化调度系统,其特征在于,所述系统包括:
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法。