中国长江电力股份有限公司曾志强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国长江电力股份有限公司申请的专利一种基于强化学习的水文径流预测模型自适应选择方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119005390B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410975082.5,技术领域涉及:G06Q10/04;该发明授权一种基于强化学习的水文径流预测模型自适应选择方法是由曾志强;鲍正风;曹辉;张海荣;杨旭;陆涛;向阳;袁晓辉;胡文斌;邹翔熙设计研发完成,并于2024-07-19向国家知识产权局提交的专利申请。
本一种基于强化学习的水文径流预测模型自适应选择方法在说明书摘要公布了:本发明公开一种基于强化学习的水文径流预测模型自适应选择方法,包括如下步骤:S1、数据准备:收集并整理某水文站的历史径流相关数据,并按时间顺序排列好;在数据分析之前,对数据进行清洗和预处理;S2、特征工程:将原始数据转换为适合机器学习模型使用的特征;S3、样本集构建和数据集划分:根据输入输出大小构建样本集,并将样本集按一定比例划分为训练集和检验集;S4、预测模型训练:使用训练集分别对数据驱动的多个单一预测模型进行训练;S5、强化学习模型训练:利用训练集和DQN算法对上述已经训练好的模型进行自适应选择,并且训练DQN模型;S6、评价指标和性能评估:本发明能在不同工况条件下自适应地选择最优预测模型。
本发明授权一种基于强化学习的水文径流预测模型自适应选择方法在权利要求书中公布了:1.一种基于强化学习的水文径流预测模型自适应选择方法,其特征在于:它包括如下步骤: S1、数据准备:收集并整理某水文站的历史径流相关数据,并按时间顺序排列好;在数据分析之前,对数据进行清洗和预处理; S2、特征工程:将原始数据转换为适合机器学习模型使用的特征; S3、样本集构建和数据集划分:根据输入输出大小构建样本集,并将样本集按一定比例划分为训练集和检验集; S4、预测模型训练:使用训练集分别对数据驱动的多个单一预测模型进行训练; S5、强化学习模型训练:利用训练集和DQN算法对上述已经训练好的模型进行自适应选择,并且训练DQN模型; S6、评价指标和性能评估:使用均方根误差、相对平方误差和纳什效率系数作为评价预测效果的指标,在评价前将归一化的预测结果反归一化为有名值;对所提出方法的预测效果与单独模型以及其他集成模型的预测效果进行比较,验证方法的优越性; 如果评价指标不合格,则返回S4-S6重新训练和评价,直到满足预测指标要求; 所述S5中DQN算法的Q-Learning更新规则和DQN的损失函数如下: 更新规则:; 损失函数:; 其中st表示t时刻的状态,at表示t时刻的动作,表示t时刻奖励,α表示学习率,γ表示奖励折扣因子; 详细算法流程如下: 首先,算法开始前随机选择一个初始状态,然后基于这个状态选择执行动作,进行一个判断,即在一定概率ξ下在动作空间中随机选择一个动作,以概率1-ξ通过Q网络选择一个Q值最大对应的动作;在编程中,由于刚开始时,Q网络中的相关参数是随机的; 在动作选择结束后,智能体执行操作后,环境将反馈奖励和下一个状态st+1;接着,智能体会将由状态、动作、奖励和下一状态构成的四元组s,a,r,st+1存储至经验池中; 接下来将下一个状态st+1视为当前状态s,重复以上步骤,直至将经验池存满; 当经验池存满之后,DQN中的网络开始更新;即开始从经验池中随机采样,将采样得到的奖励r和下一个状态st+1估算Q值,并与原来的Q值对比计算loss值,开始更新Q网络;往后就是智能体与环境交互,产生经验s,a,r,st+1,并将经验放入经验池,然后从经验池中采样更新Q网络,周而复始,直到Q网络完成收敛; 完成训练后,使用训练好的DQN模型进行测试。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国长江电力股份有限公司,其通讯地址为:430014 湖北省武汉市江岸区三阳路88号三阳中心;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励