一种基于多智能体深度强化学习鲁棒奖励函数的配电网-微电网协同最优策略方法

导航：龙图腾网> 最新专利技术> 一种基于多智能体深度强化学习鲁棒奖励函数的配电网-微电网协同最优策略方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：河海大学

摘要：本发明公布了一种基于多智能体深度强化学习鲁棒奖励函数的配电网‑微电网协同最优策略方法。微电网中，通过多智能体深度强化学习挖掘微电网的非合作博弈策略，在考虑未来收益的基础上精准给出最小化配电网运行成本且最大化微电网综合收益的策略，实现了配电网‑微电网协同最优策略。采用不确定状态的马尔可夫过程，构建了最恶劣情况下的鲁棒奖励函数；通过总变差距离将策略差值转化为奖励差值。计及配电网和微电网的约束条件和目标函数，构建了基于多智能体深度强化学习鲁棒奖励函数的配电网‑微电网协同最优策略模型。

主权项：1.一种基于多智能体深度强化学习鲁棒奖励函数的配电网-微电网协同最优策略方法，其特征在于，该方法包括以下步骤：步骤1、获取配电网网络参数和运行参数；微电网网络参数和运行参数；进行节点边际电价和微电网交互功率初始化；多智能体强化学习策略网络参数和价值网络参数初始化；时刻初始化；步骤2、获取时刻t配电网和微电网节点主动输入有功功率和无功功率数据；时刻t微电网光伏阵列和风电机组发电数据；步骤3、基于时刻t微电网交互功率，结合步骤1配电网网络参数和运行参数和步骤2配电网节点主动输入有功功率和无功功率数据，以潮流约束和其他约束为约束条件，以配电网运行成本最小为目标函数；求解得到时刻t配电网运行成本最小值，并通过计算以节点为末端节点的配电网线路传输有功功率对于配电网运行成本的偏导数计算时刻t节点边际电价；步骤4、基于时刻t节点边际电价，结合步骤2时刻t微电网节点主动输入有功功率和无功功率数据、光伏阵列和风电机组发电数据，输入多智能体深度强化学习的策略网络得到时刻t策略，策略为储能系统逆变器功率比例的采样概率；基于时刻t节点边际电价，结合步骤2时刻t微电网节点主动输入有功功率和无功功率数据、光伏阵列和风电机组发电数据，以及策略采样得到的时刻t储能系统逆变器功率比例，结合步骤1微电网网络参数和运行参数，以潮流约束、储能约束、逆变器约束为约束条件，以微电网综合收益最大为目标函数；求解得到时刻t微电网综合收益最大值和时刻t微电网交互功率；步骤5、重复步骤3和步骤4以更新时刻t节点边际电价和微电网交互功率，直到更新前后每个节点的节点边际电价差值小于0.01元kWh时停止，并输出时刻t节点边际电价、时刻t微电网综合收益最大值和时刻t微电网交互功率、策略采样得到的时刻t储能系统逆变器功率比例；步骤6、基于步骤5输出时刻t微电网综合收益最大值，赋值给多智能体深度强化学习作为实际非鲁棒奖励，基于多智能体深度强化学习实际非鲁棒奖励和鲁棒奖励函数，得到多智能体深度强化学习实际鲁棒奖励；基于步骤2时刻t微电网节点主动输入有功功率和无功功率数据、光伏阵列和风电机组发电数据，步骤5输出时刻t节点边际电价、时刻t微电网综合收益最大值和时刻t微电网交互功率，策略采样得到的时刻t储能系统逆变器功率比例，输入多智能体深度强化学习价值网络得到网络鲁棒奖励；计算价值网络参数对于实际鲁棒奖励和网络鲁棒奖励的差值平方的价值偏导数，基于价值偏导数进行梯度下降更新价值网络参数；计算策略网络参数对于网络鲁棒奖励的策略偏导数，基于策略偏导数进行梯度上升更新策略网络参数；步骤7、重复步骤2到步骤6，直到配电网和微电网负荷数据、微电网光伏阵列和风电机组发电数据的计算结束时停止。

全文数据：

权利要求：

百度查询：河海大学一种基于多智能体深度强化学习鲁棒奖励函数的配电网-微电网协同最优策略方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：为牵引电池充电的充电电路和方法、电动车辆

下一篇：印制电路板、器件焊接检测方法、装置及电子设备

相关技术

为牵引电池充电的充电电路和方法、电动车辆

印制电路板、器件焊接检测方法、装置及电子设备

叔丁醇的制造方法

一种多光子显微镜中光亮强度的自动调节装置

一种电网高影响天气特征与模式识别方法及系统

一种纳米MoOx共晶体和太阳能光热发电板

路径规划方法、系统、设备及计算机可读存储介质

一种热网加热器换热管泄漏在线定位系统及方法

一种BODIPY类化合物、制备方法及其应用

一种水库运行管理与安全评价系统及安全评价方法

塔式光热发电背板冲压平直度仿真模拟评价方法

一种1-溴乙基乙酸酯的制备方法

微电网相关技术

微电网单元逆变器的散热结构_内蒙古方维电子科技(集团)有限责任公司_202420576872.1

一种微电网安全优化方法_湖北华中电力科技开发有限责任公司_202411440412.7

微电网电热混合储能系统及方法_中国船舶重工集团公司第七0三研究所无锡分部_202411031713.4

一种微电网用调控装置_国网辽宁省电力有限公司葫芦岛供电公司_202323626349.X

一种多微电网系统优化方法、设备及存储介质_中国地质大学(武汉)_202411110904.X

微电网并离网自动控制方法及装置_广东电网有限责任公司_202111683085.4

一种直流微电网经济优化预测控制方法及系统_山东大学深圳研究院_202411130673.9

微电网供电系统及直流组网能量管理方法_武汉船用电力推进装置研究所(中国船舶集团有限公司第七一二研究所)_202411005813.X

一种基于微电网优化集成式能源控制系统_上海云锦智慧建设科技有限公司_202411071418.1

一种基于大数据的微电网智能调控系统_桂林理工大学_202411003563.6

学习相关技术

一种基于深度学习的学习质量评价系统及方法_成都工业学院_202411444397.3

一种基于自监督学习的纵向联邦学习方法_上海工程技术大学_202410871430.4

机器学习模型的联邦学习中的压缩的梯度分组_高通股份有限公司_202380031178.X

学习机的控制方法、控制装置及学习机_深圳倍爱思科技有限公司_202411140185.6

学习系统、确定系统和预测系统以及学习方法、确定方法和预测方法_富士胶片株式会社_202380031812.X

人体穴位学习系统、学习方法及人体穴位模型制作方法_中医古籍出版社有限公司_202411333351.4

一种智能学习机_北京信息职业技术学院_202411010868.X

在内代理语音以促进任务学习_渊慧科技有限公司_202380031694.2

一种平板学习机_南京百舸争流网络科技有限公司_202411116116.1

一种学习桌_育才控股集团股份有限公司_202323640076.4

鲁相关技术

布鲁顿酪氨酸激酶抑制剂_杭州邦顺制药有限公司_202411021038.7

基于鲁棒性度量学习的非侵入式负荷识别方法_浙江大学滨江研究院_202411467025.2

一种恩杂鲁胺关键中间体的合成方法_安徽峆一药业股份有限公司_202411066060.3

一种基于后门攻击防御的联邦学习鲁棒聚合方法_北京理工大学_202410776571.8

基于合同电量分解的能源基地分布鲁棒优化调度方法_国家电网有限公司华北分部_202411192286.8

一种主配协同系统自适应鲁棒优化调度方法_国网江苏省电力有限公司电力科学研究院_202411450181.8

激光陀螺仪健康状态评估的鲁棒性分析方法和装置_中国人民解放军国防科技大学_202410820904.2

基于局部代理模型的电机多目标鲁棒性优化方法_东南大学_202111560108.2

攻击环境下降低无用信息比重的鲁棒性推荐方法及系统_山东师范大学_202111462560.5

一种异常识别软件鲁棒性智能检测方法_准检河北检测技术服务有限公司_202410384238.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于多智能体深度强化学习鲁棒奖励函数的配电网-微电网协同最优策略方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务