山西省能源互联网研究院张倬恺获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山西省能源互联网研究院申请的专利基于元多智能体深度强化学习的新型电力系统多目标鲁棒优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118381030B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410534667.3,技术领域涉及:H02J3/06;该发明授权基于元多智能体深度强化学习的新型电力系统多目标鲁棒优化方法是由张倬恺;李灯熬;冯丁;周瑜设计研发完成,并于2024-04-30向国家知识产权局提交的专利申请。
本基于元多智能体深度强化学习的新型电力系统多目标鲁棒优化方法在说明书摘要公布了:本发明公开了一种基于元多智能体深度强化学习的新型电力系统多目标鲁棒优化方法,涉及风电光伏等新能源发电接入电网的优化领域。具体为:首先建模了风电光伏火电混合能源系统的多目标二阶段鲁棒优化数学模型,然后分别通过多智能体强化学习解决二阶段鲁棒优化问题、元强化学习解决多目标优化问题,最后将二者结合形成针对风电光伏火电混合能源系统的多目标二阶段鲁棒优化端到端的解决方案。本发明用于解决新能源发电接入电网的多目标二阶段鲁棒优化问题,通过先进人工智能算法,达到更高效、更灵活、更优地对调度策略的求解。本发明可以保存优化经验,可以直接使用已经训练好的神经网络模型,在实际生产应用中将大大节约计算成本和计算时间。
本发明授权基于元多智能体深度强化学习的新型电力系统多目标鲁棒优化方法在权利要求书中公布了:1.一种基于元多智能体深度强化学习的新型电力系统多目标鲁棒优化方法,其特征在于:包括如下步骤: S1:建模了风电光伏火电混合能源系统的多目标二阶段鲁棒优化数学模型; 所述多目标二阶段鲁棒优化数学模型如下: S2:分别通过多智能体强化学习解决二阶段鲁棒优化问题,采用元强化学习解决多目标优化问题;具体如下: 通过设置两个异构智能体Agent1和Agent2,Agent1负责最小化整体优化目标,Agent2负责最大化二阶段目标,具体为:Agent1通过接受当前t时刻电网的运行状态信息statet,输出一阶段解xt,Agent2则接受statet和一阶段的解xt,输出二阶段的解yt,Agent2通过影响Agent1的奖励函数来使Agent1输出的一阶段调度策略更具鲁棒性; S2-1:Agent1得到当前时刻电网的状态信息st并且输出一阶段调度策略xt; S2-2:Agent1得到当前时刻电网的状态信息st以及Agent1输出的一阶段策略xt,输出二阶段的不确定量u以及拉格朗日乘子γ; S2-3:仿真环境接受两个智能体输出的动作,返回两个智能体在这一时刻的奖励,并进入下一状态st+1;重复S2-1~S2-3,直到t=T; S2-4:根据步骤S2-1到S2-3产生的数据更新两个智能体; S3:将多智能体强化学习与元强化学习结合形成针对风电光伏火电混合能源系统的多目标二阶段鲁棒优化端到端的解决方案;具体如下: S3-1:MetaLearning元学习阶段: S3-1-1:首先初始化一个metamodel,其中包含Agent1的策略网络和价值网络与Agent2的策略网络和价值网络; S3-1-2:然后,通过均匀分布采样若干权重λ1,λ2,λ3代入数学模型中,构造多智能体强化学习环境; S3-1-3:接下来使用Reptile算法框架进行metalearning,多智能体之间的对抗学习使用IPPO算法,具体每个智能体的策略网络和价值网络的更新算法使用PPO-Clip算法; S3-1-4:当达到预设的metalearning轮数后,结束metalearning并返回metamodel; S3-2:FineTuning微调阶段: S3-2-1:首先接受metalearning后的metamodel,将metamodel拷贝Z份; S3-2-2:然后,等距采样若干权重λ1,λ2,λ3代入数学模型中,构造多智能体强化学习环境; S3-2-3:使用IPPO算法和PPO-Clip算法对每一份拷贝的metamodel分别在不同权重的多智能体强化学习环境中进行微调; S3-2-4:当达到微调轮数后,就能够使用微调过后的模型解决具体的优化调度问题,得到帕累托最优解; S3-2-5:使用所有得到的帕累托最优解,通过非支配原则,构造帕累托前沿。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山西省能源互联网研究院,其通讯地址为:030032 山西省太原市转型综合改革示范区学府产业园东融街6号中博信息产业园B栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。