一种基于深度强化学习的飞行器突防方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西北工业大学

摘要：本申请属于飞行器突防策略设计技术领域。本公开实施例是关于一种基于深度强化学习的飞行器突防方法。本公开实施例引入回归网络增强了深度神经网络的结构；根据脱靶量与能量优化的需求，提出了终端与过程组合、强奖励与弱激励引导形式的奖励函数，还在奖励函数中加入了节能因子的策略，实现对机动能耗的定量调控；在观测中引入了随机噪声，将环境的不确定性纳入了训练过程；此外提出了分层训练与课程学习结合的的策略，加快了算法的收敛速度，降低训练难度；引入了视线角速率修正因子，增强高超对视线角速率的敏度，增大了高超的突防成功率。

主权项：1.一种基于深度强化学习的飞行器突防方法，其特征在于，该方法包括：基于有两个拦截器的多体突防博弈场景，在横向平面内建立飞行器与拦截器的攻防对抗数学模型；基于攻防对抗数学模型，设计ITD3网络模型、ITD3网络模型的奖励函数和ITD3网络模型的状态观测；其中，ITD3网络模型包括回归网络、Actor网络和Critic网络，回归网络包括鉴别器和过滤器，ITD3网络模型的状态观测中引入随机噪声；利用训练数据对ITD3网络模型进行分层课程训练，以得到目标ITD3网络模型；向目标ITD3网络模型中引入视线角速率修正因子，并利用测试数据对引入视线角速率修正因子后的目标ITD3网络模型进行测试，以得到测试后的目标ITD3网络模型；利用测试后的目标ITD3网络模型对飞行器和两个拦截器的态势信息进行处理，以得到突防策略。

全文数据：

权利要求：

百度查询：西北工业大学一种基于深度强化学习的飞行器突防方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种室内立式蔬菜栽培架

下一篇：一种基于电子元器件控制的防卡死智能锁体

相关技术

一种室内立式蔬菜栽培架

一种基于电子元器件控制的防卡死智能锁体

具备适应不同体型患者的呼吸内科胸腔穿刺辅助装置

一种音频信号的处理方法、装置、系统和智能音箱设备

具有悬臂式叶轮的血液泵

碳化硅半导体装置及其制造方法

一种一体式行星齿轮组减速机构

一种通用性电机调速模块

用于处理振动信号的方法、计算设备和存储介质

降噪模型的训练方法、图像降噪方法、电子设备及介质

一种木门加工灰尘清理装置

一种汽车电子设备和菊花链通信的超时复位系统

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度强化学习的飞行器突防方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务