恭喜京东城市(北京)数字科技有限公司张玥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜京东城市(北京)数字科技有限公司申请的专利基于超参优化的深度强化学习模型的训练方法、装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113723615B 。
龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011621981.3,技术领域涉及:G06N20/00;该发明授权基于超参优化的深度强化学习模型的训练方法、装置是由张玥;尹泽夏;霍雨森;王小波;郑宇设计研发完成,并于2020-12-31向国家知识产权局提交的专利申请。
本基于超参优化的深度强化学习模型的训练方法、装置在说明书摘要公布了:本申请公开了一种基于超参优化的深度强化学习模型的训练方法、装置,其中,方法包括:获取多个初始超参数组合,和多个第一深度强化学习模型;采用初始超参数组合中的多个超参数训练多个第一深度强化学习模型,以得到与多个第一深度强化学习模型分别对应的训练评价指标;根据训练评价指标从多个第一深度强化学习模型之中筛选出第二深度强化学习模型;采用与第二深度强化学习模型对应的多个目标超参数对初始超参数组合进行优化处理,以形成目标超参数组合;得到目标深度强化学习模型。由此,将超参数优化与模型训练结合起来实现深度强化学习模型的训练,不仅可训练出性能更高的深度强化学习模型,而且可使训练出的模型适应更广泛的应用场景。
本发明授权基于超参优化的深度强化学习模型的训练方法、装置在权利要求书中公布了:1.一种基于超参优化的深度强化学习模型的训练方法,所述方法用于工业领域的燃烧优化控制,其特征在于,所述方法包括: 获取多个初始超参数组合,和多个第一深度强化学习模型; 采用所述初始超参数组合中的多个超参数训练所述多个第一深度强化学习模型,以得到与所述多个第一深度强化学习模型分别对应的训练评价指标,其中所述多个第一深度强化学习模型的输入为状态特征,输出为动作,所述状态特征包括锅炉燃烧过程中传感器采集的数据,所述动作包括燃烧过程中可以调节的控制变量; 根据所述训练评价指标从多个第一深度强化学习模型之中筛选出第二深度强化学习模型; 采用与所述第二深度强化学习模型对应的多个目标超参数对所述初始超参数组合进行优化处理,以形成目标超参数组合;以及 采用所述目标超参数组合之中的多个超参数训练所述第二深度强化学习模型,以得到目标深度强化学习模型; 其中,所述训练所述多个第一深度强化学习模型,包括: 基于所述初始超参数组合中的每一组超参数分别对第一强化学习模型进行训练,引入多GPU进行并行训练以生成模型组合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人京东城市(北京)数字科技有限公司,其通讯地址为:100086 北京市海淀区知春路76号(写字楼)1号楼9层1-7-5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。