买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于MADDPG和帕累托前沿相结合的微电网群优化调度方法及系统,建立微电网群优化调度模型;建立基于多智能体深度强化学习的模型,将微电网群调度问题框架化为马尔可夫决策过程,并定义相应的状态空间、动作空间以及奖励函数,生成多智能体强化学习模型;基于MADDPG算法引入OU过程来向强化学习中的策略添加噪声并进行训练;采集历史数据分析以获得关键能源输出和负载需求的波动曲线,并计算得到微电网群在不同行为模式下的最优策略的帕累托前沿,选择奖励值较高的策略作为最终输出结果,优化了决策过程,提高了系统在应对可再生能源波动时的适应性和鲁棒性,增强了微电网群的整体运行效率和可靠性。
主权项:1.一种基于MADDPG和帕累托前沿相结合的微电网群优化调度方法,其特征在于,包括:根据微电网群的多重目标及与微电网群调度优化相关的关键因素,建立微电网群优化调度模型,所述多重目标至少包括经济成本、环境影响及安全运行目标,与微电网群调度优化相关的关键因素包括储能系统的优化运行、柴油机及设备的操作约束;建立基于多智能体深度强化学习的模型,将微电网群调度问题框架化为马尔可夫决策过程,并定义相应的状态空间、动作空间以及奖励函数,生成多智能体强化学习模型;基于MADDPG算法对处于训练初始阶段的多智能体强化学习模型进行初始优化操作并进行训练,所述初始优化操作包括基于MADDPG算法引入OU过程来向强化学习中的策略添加噪声;采集历史数据分析以获得关键能源输出和负载需求的波动曲线,并计算得到微电网群在不同行为模式下的最优策略的帕累托前沿,选择奖励值较高的策略作为最终输出结果;所述建立微电网群优化调度模型包括多个微电网节点,每个节点包括风力发电、光伏发电、柴油发电、负载及储能设施,分别将风力发电、光伏发电及负载t时刻输出功率配置为、和;确定并配置储能设施中储能电池当前时刻的剩余电量与前一时刻的剩余电量、储能电池功率及充放电效率的关系,储能状态更新的计算如下: ,充放电约束:和,储能容量约束:,其中,和表示时间t和时间t+1时的储能状态,∆t表示时间间隔,、和分别表示储能衰减系数、充电效率和放电效率,和表示充电和放电功率;配置柴油发电作为微电网群的后备电源,柴油发电机的燃料成本计算如下: ;柴油发电机在t时刻的输出功率需满足如下爬坡约束: ;其中,为t时刻柴油发电机总燃料成本,为柴油发电机输出功率,a、b为方程系数,用于计算燃料耗量,为柴油发电机消耗单位燃料所需费用;所述建立微电网群优化调度模型还包括:配置运行时单个微电网节点在任意时刻t内部需维持电力平衡,需满足如下公式: ,电量交换的约束条件:,配置整个微电网群在t时刻的电力平衡则表述为如下公式: ,式中,为微电网节点与主电网进行交易的电量,、分别为节点j到节点i的输入电量与节点i到节点j的输出电量,j∈N,、为01变量,当节点i向节点j输出电量时,该变量取值为1,否则取值为0;当节点j向节点i输入电量时,该变量取值为1,否则取值为0;所述建立基于多智能体深度强化学习的模型包括:定义状态空间,所述状态空间包含风力发电量、光伏发电量、柴油发电量、储能状态、当前负载需求,以及与邻近节点及主电网的电力交易价格和历史交易数据及与每个微电网节点的状态在任意时刻t的相关信息,状态空间表示为: ,定义动作空间,所述动作空间包括调整各类发电设备的输出功率、储能设备的充电和放电决策、决定向邻近微电网买入或卖出的电量、以及与主电网的电力买卖及每个节点智能体能够采取的具有可能性的动作,动作空间表示为: ,定义奖励函数,构建包括经济效益影响因素、环境影响因素、供电可靠性影响因素的多目标奖励函数: ,其中,表示柴油发电维护成本,表示标量化奖励函数中各个子目标的优先级系数,表示对动作越界不符合约束的惩罚;根据智能体的状态、动作以及奖励函数对多智能体深度强化学习的模型进行训练,得到训练好的多智能体深度强化学习的模型。
全文数据:
权利要求:
百度查询: 格瓴新能源科技(杭州)有限公司 基于MADDPG和帕累托前沿相结合的微电网群优化调度方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。