清华大学深圳国际研究生院刘瑜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学深圳国际研究生院申请的专利基于强化学习的控制器参数优化方法与任务控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120255323B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510735863.1,技术领域涉及:G05B11/42;该发明授权基于强化学习的控制器参数优化方法与任务控制方法是由刘瑜;唐东繁;李徵;李劭辉;姜智卓;李耀文;何友设计研发完成,并于2025-06-04向国家知识产权局提交的专利申请。
本基于强化学习的控制器参数优化方法与任务控制方法在说明书摘要公布了:本发明提供一种基于强化学习的控制器参数优化方法与任务控制方法,涉及控制技术领域,其中方法包括:将当前次任务的PID控制器的参数输入DDPG模型中,得到下一次任务的PID控制器的参数,将下一次任务的PID控制器的参数输入PID控制器中得到控制量;将PID控制器基于控制量进行控制的评估结果确定为奖励;将当前时间步的状态、动作、奖励和下一时间步的状态作为样本数据存储至经验池中;基于经验池训练DDPG模型,将训练后的DDPG模型输出的目标参数确定为PID控制器的最优参数。在应用阶段,只需要PID控制器基于最优参数输出目标控制量,无需DDPG模型的参与,实现了整个控制模型的轻量化。
本发明授权基于强化学习的控制器参数优化方法与任务控制方法在权利要求书中公布了:1.一种基于强化学习的控制器参数优化方法,其特征在于,所述方法包括如下步骤: 将当前次任务的PID控制器的参数作为当前时间步的状态输入DDPG模型中,得到所述DDPG模型输出的所述当前时间步的动作,所述动作包括下一次任务的PID控制器的参数,所述PID控制器的参数包括以下至少一项:比例系数、积分系数和微分系数,所述PID控制器用于执行目标控制任务; 将所述下一次任务的PID控制器的参数输入所述PID控制器中,得到所述PID控制器输出的控制量,所述控制量用于对所述目标控制任务中目标元件的待控制参数进行调整; 确定所述PID控制器基于所述控制量进行控制的评估结果,将所述评估结果确定为所述动作在所述当前时间步的奖励; 将所述当前时间步的状态、所述当前时间步的动作、下一时间步的状态和所述当前时间步的奖励作为样本数据,重复执行上述步骤,将得到的多个样本数据存储至经验池中; 基于所述经验池中的样本数据对所述DDPG模型进行训练,将训练后的DDPG模型输出的目标参数确定为所述PID控制器的最优参数,所述最优参数用于所述PID控制器输出目标控制量; 所述确定所述PID控制器基于所述控制量进行控制的评估结果,包括: 基于以下公式1确定所述PID控制器基于所述控制量进行控制的评估结果: ; 其中,表示所述下一次任务对应的评估结果,所述表示所述下一次任务中第次调整的控制量对应的实际参数值与所述目标控制任务的期望值的差值,表示所述下一次任务中调整的总次数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学深圳国际研究生院,其通讯地址为:518055 广东省深圳市南山区西丽街道深圳大学城清华校区A栋二楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励