Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于元学习的空间飞行器自适应预设性能控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明属于智能控制技术领域,提出一种基于元学习的空间飞行器自适应预设性能控制方法。该方法充分考虑了系统的输入饱和问题,设计了一种灵活的预设性能控制器,使系统在满足预设性能指标的同时,有效应对输入饱和的限制。针对标称控制器,采用元学习方法对动力学模型进行离线训练,通过多种仿真情景逼近实际系统的动力学特性,提升模型的精度和泛化能力。根据离线模型,在不同仿真情景下优化控制参数,得到标称控制器的一组最优参数,增强控制系统对各种复杂环境的适应能力,实现更高效、更鲁棒的控制性能。

主权项:1.一种基于元学习的空间飞行器自适应预设性能控制方法,其特征在于,包括以下步骤:第一步:建立空间飞行器的含有扰动项的二阶非线性动力学模型;第二步:基于二阶非线性动力学模型,设计具有灵活边界的预设性能函数,并构造相应的误差转换系统;在保证系统性能的同时,引入辅助变量ηt以处理实际控制系统中常见的输入饱和问题;第三步:根据构造的误差转换系统设计李雅普诺夫函数,同时根据李雅普诺夫函数的导数设计虚拟控制律和控制信号;第四步:根据设计的控制律和系统动力学模型随机生成条对应的轨迹,轨迹中包含m秒内不同扰动下状态变量x1、x2、控制律和u的数据;通过离散化轨迹数据并选取部分作为训练数据,训练神经网络模型以逼近系统的动力学行为;第五步:定义元训练问题,根据训练后的神经网络模型在线训练得到最佳自适应参数;进一步,所述第一步,建立的含有扰动项的二阶非线性动力学模型如下: 其中,x1,x2是系统的状态变量,f2是不确定连续非线性函数,g2是常数且不为0;d是非线性二阶系统的扰动项,v表示非线性二阶系统的理想控制输入信号,uv表示相应的实际控制输入信号,y表示非线性二阶系统的输出,控制目的为设计控制器实际输入uv使系统输出y跟踪期望输出信号yd;假设d和yd都是有界的,yd的一阶导数也有界;此外,控制饱和表示如下: 式中,ud表示输入饱和的上界,sgn·表示符号函数;所述第二步具体如下:定义误差变量e1=x1-yd,构造预设性能函数ρt: 其中,ρ0,ρT,T,α*是待设计的正参数,分别为初始性能指标的值、稳定时的性能指标值、预设时间、调整系数;t表示时间,csch表示双曲正切函数,并构造误差转换系统ζt: 其中,st表示辅助变量,Elt和Eht表示误差的下界和上界,定义为[Elt,Eht]T=[elt,eht]T+Λ1tanhηt,elt和eht分别表示误差信号的上界和下界,[elt,eht]T=sgne10ρt-ρTI2+Λ2ρt,e10表示误差的初值,I2表示单位列向量,定义为I2=[11]T,Λk表示用于调节系统的动态响应的矩阵或向量,定义为Λp=[-λpλp]T,p=1,2,λp表示系统调节参数;辅助变量ηt的更新律设计为: 其中,σ1t=[sgnv-ud+1]v-ud,σ2t=[sgnv+ud-1]v+ud,m1和m2为正的设计参数,用于调节辅助系统的动态响应;所述第三步,根据含有扰动项的非线性二阶系统,定义误差变量其中,表示待设计的虚拟控制量;根据误差ζt、e2构造李雅普诺夫函数V: 对李雅普诺夫函数求导,得到 其中, 根据李雅普诺夫函数设计出的控制律表达为: 其中,k1,k2表示为待设计的正参数;所述第四步,将第三步获得的控制律作为标称控制器,根据标称控制器生成m秒的光滑轨迹,总共条,每一条轨迹的状态量初值不同;为了引入不同类型的扰动,设置了j种扰动方案,进而总共需要生成条参考轨迹;定义第j种扰动下的轨迹数据集为该集合包含一系列时刻状态变量参数控制输入以及更新后的状态变量k表示离散时序;通过离散化从所有扰动方案中选择条作为离线训练的数据集,定义训练集为训练一个深度神经网络模型使其能够通过学习条轨迹的输入-输出数据,精确拟合并逼近系统的非线性动力学特性,其中Ψj表示深度神经网络的参数集合;这一训练过程的目标定义如下: 其中,表示参考轨迹中的j条,分别表示状态量的估计值;所述第五步,定义自适应控制器待优化参数θ=k1,k2,θΠ,Γ,其中θΠ,Γ分别表示自适应律的更新律中的参数和自适应律增益;元学习的目标是通过离线优化过程,找到一组最优的控制器参数θ*,使得在不同的轨迹和扰动条件下,自适应控制器都能表现良好;训练参数的最优目标为: 其中,表示不同的标称轨迹,每一个标称轨迹对应一个独立的任务,表示在每个参考轨迹下收集到的不同扰动条件下的轨迹数据;表示标称轨迹的时间区间;μctrl表示元学习损失函数的正则化系数,μmeta表示元正则化系数,aij表示自适应项,Π表示自适应更新函数,π表示加入自适应项后的实际控制律函数;优化后,得到一组最优的控制参数θ*。

全文数据:

权利要求:

百度查询: 大连理工大学 一种基于元学习的空间飞行器自适应预设性能控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。