买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西安交通大学
摘要:本发明公开了一种预定性能下抗扰动的无人机强化学习追踪控制方法,1、设置无人机速度控制动力学系统和期望轨迹,根据期望轨迹和无人机速度控制动力学系统建立无人机追踪控制动力学系统;2、根据建立的无人机追踪控制动力学系统,建立预定性能下的无人机转换追踪误差;3、根据建立的预定性能下的无人机转换追踪误差,建立预定性能下的无人机转换追踪误差的动态;4、根据建立的预定性能下的无人机转换追踪误差的动态,建立预定性能下的无人机转换追踪控制动力学系统;5、设置二次型性能指标;6、根据设置的二次型性能指标,建立预定性能下的无人机转换追踪控制动力学系统的无人机最优控制输入和无人机最坏扰动;7、建立并训练神经网络,用于逼近性能指标;8、建立预定性能下的无人机转换追踪控制动力学系统的无人机最优控制输入的神经网络逼近和最坏扰动的神经网络逼近。通过执行无人机最优控制输入的神经网络逼近和最坏扰动的神经网络逼近,无人机实现预定性能下抗扰动的追踪控制。本发明克服了现有技术中无人机追踪控制性能和抗扰动性能不足的问题,提高了无人机的追踪控制性能和抗扰动性能。
主权项:1.一种预定性能下抗扰动的无人机强化学习追踪控制方法,其特征在于:包括如下步骤:步骤一:设置无人机速度控制动力学系统和期望轨迹xd,根据期望轨迹和无人机速度控制动力学系统建立无人机追踪控制动力学系统: 其中x为无人机速度控制动力学系统的状态变量,xd为期望轨迹的状态变量,fx为无人机速度控制动力学系统的偏移动态,gx为无人机速度控制动力学系统的输入矩阵,kx为无人机速度控制动力学系统的扰动矩阵,fd为期望轨迹的偏移动态,e=x-xd为无人机的追踪误差,为追踪误差e的导数,u为无人机控制输入,ω为无人机扰动输入;步骤二:根据步骤一建立的无人机追踪控制动力学系统,为实现无人机追踪控制过程中满足预定的误差范围,将无人机的追踪误差e映射到无人机转化追踪误差上,得到预定性能下的无人机转化追踪误差,在得到的预定性能下的无人机转化追踪误差上进行后续的追踪控制器设计即能满足预定的误差范围要求,即预定性能;预定性能下的无人机转换追踪误差如下所示:∈i=Φei,εl,i,εu,iεl,i≤ei≤εu,i其中ei为追踪误差的第i个分量,εl,i和εu,i分别为追踪误差的第i个分量的下界和上界,∈i为无人机转换追踪误差的第i个分量,Φei,εl,i,εu,i为追踪误差的第i个分量的转换函数;步骤三:根据步骤二建立的预定性能下的无人机转换追踪误差,建立预定性能下的无人机转换追踪误差的动态: 其中Φi表示无人机转化追踪误差的第i个分量关于上下界链式导数之和,为追踪误差e的第i个分量的导数,和分别为追踪误差的第i个分量的下界和上界的导数;步骤四:根据步骤三建立的预定性能下的无人机转换追踪误差的动态,建立预定性能下的无人机转换追踪控制动力学系统: 其中F=Hfx-fd,G=H×gx,K=H×kx;步骤五:根据步骤四建立的预定性能下的无人机转换追踪控制动力学系统,设置无人机二次型性能指标: 其中Q为系统状态惩罚矩阵,γ为扰动衰减系数,为无人机控制输入惩罚函数,usat为无人机控制输入饱和值,R为无人机控制输入惩罚矩阵;步骤六:根据步骤五设置的无人机二次型性能指标,建立预定性能下的无人机转换追踪控制动力学系统的无人机最优控制输入和无人机最坏扰动: 其中为无人机二次型性能指标J的梯度,u*为无人机最优控制输入,ω*为无人机最坏扰动;步骤七:根据步骤五建立的无人机二次型性能指标与步骤六建立的预定性能下的无人机转换追踪控制动力学系统的无人机最优控制输入和无人机最坏扰动,建立并训练神经网络,用于逼近无人机二次型性能指标J: 其中为神经网络的权重,ψ∈为神经网络的基元,为无人机二次型性能指标的神经网络逼近;步骤八:根据步骤七建立的神经网络,建立预定性能下的无人机转换追踪控制动力学系统的无人机最优控制输入的神经网络逼近和最坏扰动的神经网络逼近: 其中为无人机最优控制输入的神经网络逼近,为无人机最坏扰动的神经网络逼近;通过计算步骤八设计的的无人机最优控制输入的神经网络逼近和最坏扰动的神经网络逼近,无人机实现预定性能下抗扰动的追踪控制,提高了无人机的追踪控制性能和抗扰动性能。
全文数据:
权利要求:
百度查询: 西安交通大学 一种预定性能下抗扰动的无人机强化学习追踪控制方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。