Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京信息工程大学曾俊博获国家专利权

南京信息工程大学曾俊博获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京信息工程大学申请的专利基于强化学习的四旋翼无人机有限时间滑模姿态控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121300437B

龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511861039.7,技术领域涉及:G05D1/49;该发明授权基于强化学习的四旋翼无人机有限时间滑模姿态控制方法是由曾俊博;薛艳梅;刘艳;李鑫鑫;郑柏超设计研发完成,并于2025-12-11向国家知识产权局提交的专利申请。

基于强化学习的四旋翼无人机有限时间滑模姿态控制方法在说明书摘要公布了:本发明公开了基于强化学习的四旋翼无人机有限时间滑模姿态控制方法,包括:建立考虑外界扰动及模型不确定性的四旋翼无人机姿态动力学模型,并改写为标准状态方程形式;设计基于非奇异积分终端滑模方法的控制器标称项,设计含时变矩阵的到达控制律项,到达控制律项和标称项之和为姿态控制器;基于强化学习原理,构造扩展的马尔科夫决策过程,设计相应的状态集合、动作集合、动作实现映射、奖励函数等,时变矩阵通过强化学习训练得到并在线整定。本发明方法有效地提高了系统动态性能及稳态性能,同时在湍流扰动下具有较强的鲁棒性。

本发明授权基于强化学习的四旋翼无人机有限时间滑模姿态控制方法在权利要求书中公布了:1.基于强化学习的四旋翼无人机有限时间滑模姿态控制方法,其特征在于,包括如下步骤: 步骤1,考虑外界扰动及模型不确定性,建立四旋翼无人机姿态动力学模型,并变换为标准状态方程形式; 步骤2,构造非奇异积分终端滑模函数,设计得到姿态控制器的标称项;同时设计含时变矩阵的到达控制律项,到达控制律项和标称项之和为姿态控制器;具体过程如下: 定义姿态角度跟踪误差向量为: ,式中,,和分别为滚转角、俯仰角和偏航角的跟踪误差,为姿态角状态向量,,,和分别为四旋翼无人机的滚转角、俯仰角和偏航角;为期望的姿态角向量,,和分别为期望的滚转角、俯仰角和偏航角; 定义向量为: ,式中,,和均表示中间变量,为姿态角速度状态向量,,和分别为滚转角、俯仰角和偏航角的角速度状态变量;为期望的姿态角速度向量,,和分别为期望的滚转角速度、俯仰角速度和偏航角速度,为对角矩阵,,参数和满足、、; 构造非奇异积分终端滑模函数,确保在有限时间内收敛到零: ,式中,,和分别为滚转角、俯仰角和偏航角的滑模函数,表示当前时刻,表示0到之间的任意时刻,为对角矩阵,,参数和满足、、;为幂指数向量,,为与维度相同的全1向量,和均为奇数,且、、;对求导,并令,忽略总扰动,得到姿态控制器的标称项为: ,式中,为四旋翼无人机机体的转动惯量矩阵,,和分别为机体绕和轴的转动惯量,,为姿态角误差变化率向量,,和分别为滚转角、俯仰角和偏航角跟踪误差变化率; 设计基于强化学习的时变到达控制律为: ,式中,为参数,满足;为符号函数,,和均表示中间变量,满足;和均为时变矩阵: ,,式中,和均为控制参数,、、、、、; 则姿态控制器为: ,式中,,和分别为滚转、俯仰和偏航通道的控制力矩,且,式中,和分别为四旋翼无人机的滚转角速度、俯仰角速度和偏航角速度,和分别为四旋翼无人机的滚转角加速度、俯仰角加速度和偏航角加速度; 步骤3,构建扩展的马尔科夫决策过程,刻画姿态跟踪下基于强化学习的时变矩阵优化整定,定义四旋翼无人机三轴姿态角误差及其变化率为状态,强化学习中策略网络的输出为动作,将四旋翼无人机三轴姿态角误差及其变化率作为策略网络的输入,设计动作实现映射,将策略网络的输出映射为控制参数动作,从而得到时变矩阵; 将四旋翼无人机三轴姿态角误差及其变化率和策略网络的输出作为强化学习中价值网络的输入,设计针对控制性能的奖励函数,对策略网络的输出进行评估并反馈至策略网络,进而生成下一个动作,实现四旋翼无人机姿态控制; 步骤3的具体过程如下: 构建如下扩展的马尔科夫决策过程,刻画姿态跟踪下基于强化学习的时变矩阵更新机制: ,式中,为状态集合,为动作集合,为状态转移核,为即时奖励,为折扣因子,为动作实现映射,为行为噪声过程; 定义状态集合为6维向量,依据无人机姿态角跟踪目标,取三轴姿态角误差及其变化率作为状态: ,式中,为实数向量空间; 定义动作集合为6维向量: ,式中,和均为参数; 控制参数动作由通过动作实现映射得到: ,式中,为映射后的控制参数动作向量,为防止控制参数趋于0的常数下限,为动作缩放矩阵,,,为第个控制参数的缩放系数,第1至第6个控制参数依次为;为控制参数动作下界向量,,分别为各控制参数的动作下界; 动作映射对的雅可比矩阵表示为: ,式中,表示双曲正割函数;经映射后的控制参数动作向量表示为: ,从而得到时变矩阵及;决策过程中的状态转移表示为:给定当前状态及控制参数动作,经过控制律及外界扰动转化为下一个状态; 根据控制性能目标,同时考虑控制输出表现,设计奖励函数如下: ,,,,式中,和均为权重参数,满足、、;为分段函数,表示为: ,式中,均为常数,、;为当前决策结束时姿态角误差向量的2范数,为控制能量的度量,,为当前决策时由控制律产生的三轴控制力矩向量,,和分别为滚转、俯仰和偏航通道当前决策时由控制律产生的控制力矩; 步骤4,策略网络和价值网络在训练过程中,采用深度确定性梯度算法进行参数更新。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京信息工程大学,其通讯地址为:210032 江苏省南京市江北新区宁六路219号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。