鲁棒强化学习与对抗强化学习的无人机控制方法及装置

导航：龙图腾网> 最新专利技术> 鲁棒强化学习与对抗强化学习的无人机控制方法及装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明涉及计算机技术领域，特别涉及一种鲁棒强化学习与对抗强化学习的无人机控制方法及装置。所述方法包括：初始化无人机系统，获取无人机的当前状态；基于当前状态，计算无人机的鲁棒部分控制量，基于鲁棒部分控制量判断是否需要触发强化学习控制输出准确控制量；将准确控制量输入至无人机系统，得到奖励；对强化学习控制器和对抗网络进行更新，并判断强化学习控制器和对抗网络是否收敛，保存网络参数，完成基于鲁棒强化学习与对抗强化学习的无人机控制。本发明既可以保证在训练前期施加较小的扰动保证强化学习控制模块网络可以收敛，也可以保证在训练后期施加尽可能大的干扰，以提高强化学习控制模块网络的抗扰能力。

主权项：1.一种鲁棒强化学习与对抗强化学习的无人机控制方法，其特征在于，所述方法包括：S1、初始化无人机系统，获取无人机的当前状态；S2、基于所述当前状态，计算所述无人机的鲁棒部分控制量，基于所述鲁棒部分控制量判断是否需要触发强化学习控制，若是，则进行鲁棒部分控制量的扩展，并通过强化学习控制器和对抗网络分别输出准确控制量；若否，则直接将鲁棒部分控制量作为准确控制量；S3、将所述准确控制量输入至无人机系统，得到奖励；S4、将奖励、动作以及准确控制量作为经验，对所述强化学习控制器和对抗网络进行更新，并判断所述强化学习控制器和对抗网络是否收敛，若否，则返回S2；若是，则保存网络参数，完成基于鲁棒强化学习与对抗强化学习的无人机控制。

全文数据：

权利要求：

百度查询：北京科技大学鲁棒强化学习与对抗强化学习的无人机控制方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：3,7-二甲基黄嘌呤的制备方法

下一篇：一种基于信息物理系统的热连轧活套张力控制方法

相关技术

3,7-二甲基黄嘌呤的制备方法

一种基于信息物理系统的热连轧活套张力控制方法

基于大模型的电力电缆故障预警系统及方法

一种具有气体发生器的冷柜

一种基于无人机的绝缘子冲洗机械手

一种公共事件应对决策的属性及权重确定方法和系统

视频处理方法、装置、设备、存储介质及计算机程序产品

一种船舶交通数据分类识别的智能交通管理系统

一种破碎设备及用于中药饮片加工的破碎方法

一种药物球囊扩张导管和介入式医疗器械

一种水利工程水渠格栅控制系统及控制方法

一种流表统计信息上报方法、装置、设备及存储介质

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

鲁棒强化学习与对抗强化学习的无人机控制方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务