买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国电子科技集团公司第五十四研究所
摘要:本发明公开了一种基于多级剪枝轻量化网络的通信干扰策略生成方法,属于人工智能和强化学习技术领域。本方法包括使用基于PDQN的多层强化学习网络模型进行通信干扰策略生成建模,并使用多级剪枝进行模型轻量化,以符合在算力较低平台的部署,轻量化后的模型包括Q‑Network和Actor,分别输出干扰类型和相应参数,并采用双阶阈值策略加快训练速度,最后构造基于对抗策略的奖励函数,用于引导频率对齐,并模型以较少的干扰资源实现目标误码率。通过基于多级剪枝轻量化网络的通信干扰策略生成方法,实现了通信对抗方对通信方的智能认知干扰,并通过轻量化方法解决了其在算力较低平台的部署问题,同时模型设计多种更新加速方法,提升了学习效率,贴近通信对抗需求。
主权项:1.一种基于多级剪枝轻量化网络的通信干扰策略生成方法,其特征在于,包括以下步骤:步骤1,设置通信干扰对抗环境,包括一台通信侦察机、一台通信干扰机、一台通信发射机和一台通信接收机,其中,通信发射机用于发射通信信号,通信接收机用于接收通信信号和干扰信号,并计算误码率,通信发射机和通信接收机根据信号受扰情况改变通信策略;通信侦察机用于对通信发射机发射的通信信号进行侦察,获取频率、带宽、符号速率、调制样式和信号电平;通信干扰机用于根据侦察获取的参数和通信误码率调整干扰策略,并发射连续波干扰信号、脉冲干扰信号、梳状谱干扰信号和扫频干扰信号;步骤2,设置通信策略为通信方受到干扰后,在降低调制阶数、提高通信发射功率和降低通信符号速率三种调整措施中随机选取一种,当三种调整措施均无法产生作用时,则随机更换通信信道;并设置初始干扰策略为预训练分层强化学习网络mbase产生的分级策略,预训练分层强化学习网络mbase的参数为预先在对抗环境中训练得到;其中预训练分层强化学习网络mbase包括Q-Network网络和Actor网络,产生的分级策略为at,xt,at为选取的干扰类型,Q-Network网络输出,xt为每种干扰类型对应的干扰参数,Actor网络输出;步骤3,对预训练分层强化学习网络mbasse的超参数进行初始化,初始化的超参数包括学习率、批次大小、经验回放存储大小和折扣因子;步骤4,对预训练分层强化学习网络mbase的每一层按照评估重要度Ek进行剪枝率计算,以剪枝率作为网络模型每层掩码的比例进行多级剪枝,形成轻量化网络mp;步骤5,对进行剪枝后的轻量化网络mp重新训练,其中通信发射机发射通信信号,以通信侦察机得到的t时刻通信信号参数作为状态空间st,输入到mp中,以重训练策略得到t时刻动作值,包括干扰类型at和干扰参数xt;步骤6,根据干扰类型at和干扰参数xt,通信干扰机发射相应的干扰信号,将干扰信号与通信信号叠加,通信接收机接收叠加信号,并将信号进行解码,得到误码率BERt,根据BERt与设定阈值的大小关系,得到干扰任务是否完成的标志Dt,并通过奖赏函数计算奖赏值rt;步骤7,根据误码率BERt,按照通信策略更新通信发射机的信号参数,获取下一时刻的状态空间st+1,并将{at,xt,st,st+1,Dt,rt}存入经验池中;步骤8,从经验池中抽样{ab,xb,sb,sb+1,Db,rb},将sb+1输入到Actor网络中,得到动作值xb+1,然后将sb+1与xb+1输入到Q-Network网络中,得到ab+1;将sb与xb输入到Q-Network网络中,得到最后将ab+1、和rb带入到损失函数lQ中,更新网络参数;步骤9,将sb输入到Actor网络中,得到动作值x′b,然后将sb与x′b输入到Q-Network网络中,得到a′b,将a′b带入到损失函数lθ中,更新网络参数;步骤10,重复步骤5-步骤9,直到重复次数达到最大迭代次数,或者误码率达到阈值,训练停止。
全文数据:
权利要求:
百度查询: 中国电子科技集团公司第五十四研究所 一种基于多级剪枝轻量化网络的通信干扰策略生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。