买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及计算机技术领域,特别涉及一种鲁棒强化学习与对抗强化学习的无人机控制方法及装置。所述方法包括:初始化无人机系统,获取无人机的当前状态;基于当前状态,计算无人机的鲁棒部分控制量,基于鲁棒部分控制量判断是否需要触发强化学习控制输出准确控制量;将准确控制量输入至无人机系统,得到奖励;对强化学习控制器和对抗网络进行更新,并判断强化学习控制器和对抗网络是否收敛,保存网络参数,完成基于鲁棒强化学习与对抗强化学习的无人机控制。本发明既可以保证在训练前期施加较小的扰动保证强化学习控制模块网络可以收敛,也可以保证在训练后期施加尽可能大的干扰,以提高强化学习控制模块网络的抗扰能力。
主权项:1.一种鲁棒强化学习与对抗强化学习的无人机控制方法,其特征在于,所述方法包括:S1、初始化无人机系统,获取无人机的当前状态;S2、基于所述当前状态,计算所述无人机的鲁棒部分控制量,基于所述鲁棒部分控制量判断是否需要触发强化学习控制,若是,则进行鲁棒部分控制量的扩展,并通过强化学习控制器和对抗网络分别输出准确控制量;若否,则直接将鲁棒部分控制量作为准确控制量;S3、将所述准确控制量输入至无人机系统,得到奖励;S4、将奖励、动作以及准确控制量作为经验,对所述强化学习控制器和对抗网络进行更新,并判断所述强化学习控制器和对抗网络是否收敛,若否,则返回S2;若是,则保存网络参数,完成基于鲁棒强化学习与对抗强化学习的无人机控制。
全文数据:
权利要求:
百度查询: 北京科技大学 鲁棒强化学习与对抗强化学习的无人机控制方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。