广东电网有限责任公司广州供电局吴任博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东电网有限责任公司广州供电局申请的专利基于PPO算法的数据模型混合驱动风电场建模方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115392110B 。
龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210889254.8,技术领域涉及:G06F30/27;该发明授权基于PPO算法的数据模型混合驱动风电场建模方法是由吴任博;张扬;赵宏伟;卢有飞;梁雪青;刘璐豪;陈明辉;张少凡;邹时容;蔡燕春;刘璇;赖德翔;苏杰设计研发完成,并于2022-07-27向国家知识产权局提交的专利申请。
本基于PPO算法的数据模型混合驱动风电场建模方法在说明书摘要公布了:本发明公开了一种基于PPO算法的数据模型混合驱动风电场建模方法,包括以下步骤:S1、收集风电场在经受扰动后的量测数据;S2、构建风电场等值机模型,运用微分方程来描述风电场在经受扰动后的暂态过程,依据微分方程组构建等值机模型;S3、参数初值设置与灵敏度分析,对双馈风机的电机参数和控制参数进行轨迹灵敏度分析;S4、基于PPO强化学习算法的参数辨识。本发明融合了机理模型建模和参数辨识的方法,建立的等值机模型具有明确的物理意义,同时无需预先知道每台风机的准确参数,显著降低了数据获取的难度,并且运用深度强化学习算法代替原有的粒子群算法,提高了参数辨识的效率。
本发明授权基于PPO算法的数据模型混合驱动风电场建模方法在权利要求书中公布了:1.基于PPO算法的数据模型混合驱动风电场建模方法,其特征在于,包括以下步骤: S1、收集风电场在经受扰动后的量测数据,在其经受扰动后,采集扰动前后和扰动过程中的风电场电压和功率数据; S2、构建风电场等值机模型,运用微分方程来描述风电场在经受扰动后的暂态过程,依据微分方程组构建等值机模型; S3、参数初值设置与灵敏度分析,对双馈风机的电机参数和控制参数进行轨迹灵敏度分析; S4、基于PPO强化学习算法的参数辨识; 基于PPO强化学习算法的参数辨识具体为: 首先输入原始风电场产生的功率数据和以及待辨识参数的初值; 基于PPO强化学习算法,使用连续步长对等值机的待辨识参数进行修正;强化学习的几个要素为状态state、动作action和奖励reward,其中状态为一个6维向量即待辨识参数构成的向量,在每一步的动作中,所有待辨识变量均会叠加一个修正量,即动作向量从而得到下一个状态 修正等值机的参数,并且运行仿真模型拟合出功率曲线P和Q,如果拟合出的功率曲线与原始功率曲线的误差较小,则输出参数辨识的结果,否则将功率曲线拟合均方差的相反数作为环境反馈给智能体的奖励rt,继续进行训练,并且计算出时序差分残差δt: 其中,γ表示衰减因子,表示策略π的状态价值函数,计算得到的残差用于对PPO算法的神经网络参数进行更新;迭代的过程会逐步修正等值机的待辨识参数和深度强化学习神经网络的参数,直至功率曲线的误差达到允许的范围; PPO算法中,采用Actor神经网络确定修正量ΔTJ,ΔRs,ΔRr,ΔLm,服从的概率密度函数; 假设每个待辨识参数的修正量都服从正态分布,Actor网络的输入向量是当前的状态向量,输出向量是各个修正量的数学期望值,之后在正态分布中抽样,确定这一步的动作向量Actor网络更新参数的目标是最优化策略函数,参数更新迭代的策略表示为: 其中,θk表示当前策略网络的参数,表示当前策略的优势函数,ε是一个超参数,用于限制截断范围; 采用Critic神经网络确定某种状态的价值; 采取时序差分残差的学习方式,减小Critic网络的估计误差,其参数更新策略表示为: 其中,ω表示Critic网络的参数,αω表示学习率,δt表示时序差分残差,表示状态价值函数的梯度; 在训练神经网络的过程中,需要使用Adam算法作为优化器,同时需要将输入的参数进行归一化,并在每层神经网络的激活函数后面进行批标准化处理,来提高神经网络训练的效率和收敛性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东电网有限责任公司广州供电局,其通讯地址为:510620 广东省广州市天河区天河南二路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。