恭喜北京航空航天大学张坤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京航空航天大学申请的专利一种基于扰动观测器的在线传递启发式动态规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118467895B 。
龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410491460.2,技术领域涉及:G06F17/11;该发明授权一种基于扰动观测器的在线传递启发式动态规划方法是由张坤;张振华;王可东设计研发完成,并于2024-04-23向国家知识产权局提交的专利申请。
本一种基于扰动观测器的在线传递启发式动态规划方法在说明书摘要公布了:本发明公开了一种基于扰动观测器的在线传递启发式动态规划方法,属于非线性时变时滞系统控制领域,采用迁移学习与自适应批评控制相结合的方法;利用从源任务收集的样本数据来获取先验知识,为非线性离散系统设计鲁棒的最优控制策略,并用于指导目标任务的非线性系统的在线控制过程;提出了一种具有截断机制的新型衰减函数,以避免负传递效应并节省计算资源;提出了一种扰动补偿控制机制来解决不确定性;证明了鲁棒最优控制下的不确定非线性系统的特性以及神经网络的权重误差在给定的某些条件下最终是一致有界的。
本发明授权一种基于扰动观测器的在线传递启发式动态规划方法在权利要求书中公布了:1.一种基于扰动观测器的在线传递启发式动态规划方法,其特征在于:包括如下步骤: S1、构建带有扰动的一般非线性系统模型; S2、构建性能指标函数,并设计两部分控制输入; S3、构建源任务和目标任务,设计包含截断机制的时间递减转移函数; S4、构建扰动观测器来估计干扰dk,并设计基于观测器的扰动补偿控制; S5、针对源任务构建神经网络,设计权重更新率; S6、针对目标任务构建神经网络,设计权重更新率; S7、计算鲁棒最优控制律,更新系统状态; 其中,在步骤S3中,任务T由状态空间S、行动空间C、系统函数H·和效用函数N·组成;表示为T={S,C,H·,N·};任务的目标是最小化成本函数,即最小化效用函数之和; 将源任务和目标任务分别定义为Ts={S′,C′,H′·,N·},Tt={S,C,H·,N·};在Ts中训练成熟的评估策略被用来促进Tt的学习过程; 设包含截断机制的时间递减转移函数为: 其中,a、b、c和m是可调整的参数,决定了所转移的知识对Tt的影响;其中,a和b为正数,以确保函数单调递减;a、b和c的选择应满足0ηk1的条件;m为正数,表示截断阈值;如果ηk小于m,则认为转移知识的影响忽略不计;因此,包含转移知识的新成本函数表示为: Vxk=ηkJtrxk+1-ηkJdxk, 其中,Jtrxk是作为Ts先验知识的评估策略,Jdxk是Tt的评估策略;因此,最优策略u*xk符合; 其中,在步骤S4中,为估计干扰dk,设计干扰观测器为: 其中,|zi|1,i∈[1,w];是gd中间变量,pk∈Rw是中间变量,是估计扰动;得出扰动误差为的动态方程: 对于系统如果增益矩阵Z是舒尔矩阵,则和的上界满足以下不等式: 设计扰动补偿控制鲁棒最优控制表示如下: 带有控制输入的系统表示为: 考虑到输入为u*xk且由定义的闭环系统,状态xk和观测误差都具有稳定性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。