基于神经网络虚拟自我对局的雷达干扰博弈策略设计方法

导航：龙图腾网> 最新专利技术> 基于神经网络虚拟自我对局的雷达干扰博弈策略设计方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西安电子科技大学

摘要：本发明公开了一种基于神经网络虚拟自我对局的雷达干扰博弈策略设计方法，包括：构建雷达和干扰机对应的扩展式多回合博弈交互模型；其中，所述雷达和干扰机分别设置为神经网络虚拟自我对局中的主体：基于所述扩展式多回合博弈交互模型，获取雷达和干扰机之间的交互信息，并对所述交互信息进行编码，所述交互信息中包括博弈状态转移信息和最优反应行为信息；基于神经网络虚拟自我对局对编码后的交互信息进行求解，以获取雷达和干扰机之间的多个博弈策略组合；获取每个博弈策略组合的平均利用度，并将平均利用度最小值对应的博弈策略组合确定为目标博弈策略组合。本发明能够高效、准确地获取雷达和干扰机之间的博弈情况。

主权项：1.一种基于神经网络虚拟自我对局的雷达干扰博弈策略设计方法，其特征在于，所述方法包括：步骤1：构建雷达和干扰机对应的扩展式多回合博弈交互模型；其中，所述雷达和干扰机分别设置为神经网络虚拟自我对局中的主体；步骤2：基于所述扩展式多回合博弈交互模型，获取雷达和干扰机之间的交互信息，并对所述交互信息进行编码，所述交互信息中包括博弈状态转移信息和最优反应行为信息；步骤3：基于神经网络虚拟自我对局对编码后的交互信息进行求解，以获取雷达和干扰机之间的多个博弈策略组合；步骤4：获取每个博弈策略组合的平均利用度，并将平均利用度最小值对应的博弈策略组合确定为目标博弈策略组合；所述博弈状态转移信息对应有强化学习记忆池所述最优反应行为信息对应有监督学习记忆池所述步骤3包括：步骤3-1：初始化所述强化学习记忆池和所述监督学习记忆池步骤3-2：通过随机参数θΠ对平均策略网络Πs,a|θΠ进行初始化，其中，s表示博弈信息状态，θΠ表示策略网络参数；步骤3-3：通过随机参数θQ对深度强化学习评估网络Qs,a|θQ进行初始化，其中，θQ表示评估网络参数；步骤3-4：构建深度强化学习目标网络Qs,a|θQ'，其中，θQ'表示目标网络参数；并将评估网络参数赋给目标网络参数，表示为：θQ′←θQ；步骤3-5：初始化预期参数η；步骤3-6：开始外层循环，其中，外层循环的循环次数为雷达和干扰机的训练次数，若当前循环次数大于训练次数，执行步骤3-18；步骤3-7：将混合策略σ表示为：步骤3-8：获取初始状态信息s1和回报信息r1；步骤3-9：开始内层循环，其中，内层循环的循环次数为雷达和干扰机之间的交互回合的回合数，若当前循环次数大于回合数，则将外层循环次数加一并重复执行步骤3-6至步骤3-9；步骤3-10：基于所述混合策略σ，采样行动at，其中，at表示行动；步骤3-11：在博弈中执行行动at，并获取回报信息rt+1以及状态信息st+1；步骤3-12：将博弈中的转移经验st,at,rt+1,st+1存储到强化学习记忆池中；步骤3-13：在主体当前执行的是近似最优反应策略σ＝∈-greedy时，将状态及动作二元组st,at存储到监督学习记忆池中；步骤3-14：基于损失函数对θΠ进行更新，表示为：步骤3-15：基于所述损失函数对θQ进行更新，表示为：步骤3-16：按照预设周期，更新目标网络参数θQ′←θQ；步骤3-17：当内层循环执行完毕，将循环次数加一并重复执行步骤3-9；步骤3-20：当外层循环执行完毕，得到雷达和干扰机之间的多个博弈策略组合。

全文数据：

权利要求：

百度查询：西安电子科技大学基于神经网络虚拟自我对局的雷达干扰博弈策略设计方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：具有悬臂式叶轮的血液泵

下一篇：一种汽车减震器的衬套装配装置

相关技术

具有悬臂式叶轮的血液泵

一种汽车减震器的衬套装配装置

水泵减振装置

用于传递和存储用于ESIM设备变更的激活码的方法和装置

一种无施工平台的远岸成品钢管桩的测量方法

监控视频的轮巡控制方法、装置、设备及存储介质

一种音频信号的处理方法、装置、系统和智能音箱设备

一种基于数字密钥的电子公文管理系统及方法

一种AGV随行系统、方法、装置、设备及存储介质

一种变电站光伏系统发电量与站用电负荷匹配的控制系统及控制方法

基于FPN的复杂环境典型树木高效智能识别方法及系统

新能源多场站柔性直流外送系统强度评估方法、装置

干扰相关技术

一种抗干扰水表_丰天鼎业科技有限公司_202420726189.1

用于数据总线的抗干扰电路_北京星网锐捷网络技术有限公司_202110145291.3

用于进行干扰电弧保护的方法_西门子股份公司_202380027852.7

一种测控链路干扰识别方法_中国人民解放军空军工程大学_202411107214.9

一种降噪抗干扰的监控设备_吉林省信瑞智能科技有限公司_202420567290.7

抑制无线信号干扰的设备及通信基站_中国电信股份有限公司_202210412164.X

红外信号的干扰检测方法和投影设备_安克创新科技股份有限公司_202310544655.4

一种抗电磁干扰热电偶_安徽诚飞电器电缆有限公司_202320540410.X

一种矿井泵数据监测防干扰装置_陕西陕煤曹家滩矿业有限公司_202420762750.1

一种抗干扰的腔体式安装结构_四川指南熊医疗科技有限公司_202411305617.4

雷达相关技术

雷达料位计安装结构_中国联合工程有限公司_202420887920.9

一种雷达结构_惠州市德赛西威智能交通技术研究院有限公司_202410999292.8

一种雷达物位计_陕西诗奈电子科技有限公司_202420722467.6

数据处理系统与激光雷达芯片、激光雷达_深圳市速腾聚创科技有限公司_202410824937.4

测试雷达传感器的雷达模拟器和方法_罗德施瓦兹两合股份有限公司_202410336892.6

雷达数据处理装置、激光雷达以及数据传输方法_宁波舜宇车载光学技术有限公司_202411427914.6

基于激光雷达和毫米波雷达获取矿区信息的方法_安徽海博智能科技有限责任公司_202011307165.5

一种集成式激光雷达发射装置及激光雷达_苏州万集车联网技术有限公司_202323587719.3

一种固态激光雷达的收发对准方法及固态激光雷达_上海禾赛科技有限公司_202310546977.2

一种大视场激光雷达发射系统及激光雷达_苏州万集车联网技术有限公司_202323586566.0

博弈相关技术

基于多元博弈的综合能源系统能-碳互动调度方法及装置_天津大学_202410095557.1

基于微分博弈的追踪逃逸覆盖控制方法、设备及存储设备_中国地质大学(武汉)_202411031961.9

混合无人机编队协同博弈的智能决策方法和系统_江淮前沿技术协同创新中心_202411005769.2

一种面向复杂装备体系对抗的智能博弈训练与仿真装置_北京创奇视界科技有限公司_202210999053.3

基于博弈论的时间敏感网络中突发流量调度方法及装置_北京邮电大学_202410894660.2

计及工业负荷能效的电网需求响应主从博弈奖惩激励方法及系统_南京工程学院_202410752587.5

一种基于动态多能定价的低碳综合能源系统混合博弈运行方法_天津大学_202411016160.5

基于不完全信息双层博弈的综合能源优化运行方法及系统_山东大学_202410998073.8

一种基于用户可信度的移动边缘网络非协作博弈转发方法_河南中医药大学_202210363950.5

一种应用于逼近空间非合作巨星座的预测追逃博弈控制方法及系统_哈尔滨工业大学_202411018233.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于神经网络虚拟自我对局的雷达干扰博弈策略设计方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务