恭喜南京航空航天大学丁锐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京航空航天大学申请的专利一种面向无人机频谱共享网络的资源优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117880821B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410040985.4,技术领域涉及:H04W16/14;该发明授权一种面向无人机频谱共享网络的资源优化方法是由丁锐;周福辉;吴伟;丁家昕;董超;吴启晖设计研发完成,并于2024-01-11向国家知识产权局提交的专利申请。
本一种面向无人机频谱共享网络的资源优化方法在说明书摘要公布了:本发明公开了一种面向无人机频谱共享网络的资源优化方法,属于无线通信的技术领域,方法包括以下步骤:构建子频段智能体和认知无人机的输入状态信息变量;确定主用户和次级用户的传输速率,并构建奖励函数;训练时,利用AC算法的动作网络选择子频段智能体的动作输出,并确定子频段智能体的即时奖励;利用DDPG算法的动作网络选择认知无人机的动作输出,并确定认知无人机的即时奖励;当训练回合的步数达到本次训练回合的总步数时,更新AC算法和DDPG算法网络参数;不断训练,直至满足训练回合的设定轮数,输出优化模型,并利用输出的优化模型进行资源优化;本申请的方法提升了数据利用效率和计算效率,同时降低了对数据存储的依赖性。
本发明授权一种面向无人机频谱共享网络的资源优化方法在权利要求书中公布了:1.一种面向无人机频谱共享网络的资源优化方法,其特征在于,包括:构建子频段智能体的输入状态信息变量和认知无人机的输入状态信息变量;确定主用户和次级用户的传输速率,并构建奖励函数;初始化训练回合的轮数和步数,训练时,基于当前子频段智能体的输入状态信息利用AC算法的动作网络选择子频段智能体的动作输出,并确定子频段智能体的即时奖励;基于当前认知无人机的输入状态信息利用DDPG算法的动作网络选择认知无人机的动作输出,并确定认知无人机的即时奖励;当训练回合的步数达到本次训练回合的总步数时,更新AC算法网络参数和DDPG算法网络参数;根据AC算法网络参数和DDPG算法网络参数的更新结果,不断训练,直至满足训练回合的设定轮数,输出优化模型,并利用输出的优化模型进行资源优化;所述构建子频段智能体的输入状态信息变量和认知无人机的输入状态信息变量中:所述子频段智能体的输入状态信息变量为: 所述认知无人机的输入状态信息变量为: 其中,为第k个子频段智能体在第n个时间步长时的输入状态信息,表示第k个子频段智能体在第n-1个时间步长时的频段分配策略;In-1,k为n-1时刻第k个次级用户在当前子频段受到的干扰,Hn,k为信道功率增益;为第n-1个时间步长时子频段智能体的位置;为第n-1个时间步长时认知无人机的位置;所述信道功率增益Hn,k为: 其中,为认知无人机到第k个次级用户的信道功率增益,为干扰无人机到第k个次级用户的信道功率增益,为主基站到k个次级用户的信道功率增益;所述确定主用户和次级用户的传输速率,并构建奖励函数中,所述主用户的传输速率为: 所述次级用户的传输速率为: 其中,B为每个子频段的带宽,为第k个次级用户在n时隙m子频段时的信噪比,为第j个主用户在n时隙m子频段时的信噪比;第j个主用户在n时隙m子频段时的信噪比为: 第k个次级用户在n时隙m子频段时的信噪比为: 其中,为主基站在第m个子频段上的发射功率,为主基站到第j个主用户之间的信道功率增益;为第j个主用户的噪声功率,ρk,n[m]表示第m个子频段是否被占用,Pc为认知无人机额发射功率,为在n时隙认知无人机到第j个主用户的信道功率增益;为第m个子频段是否被干扰无人机占用,PJ为干扰无人机的发射功率,为在n时隙干扰无人机到第j个主用户的信道功率增益; 为认知无人机到第k个次级用户的信道功率增益,为第k个次级用户的噪声功率;为主基站到第k个次级用户之间的信道功率增益,为n时隙干扰无人机到第k个次级用户之间的信道功率增益;所述确定主用户和次级用户的传输速率,并构建奖励函数中,所述奖励函数为: 其中,为第k个主用户的传输速率,w1为主用户传输速率和的权重,δj为当主用户的最小传输速率未被满足时的惩罚项,w2为惩罚项和的权重,当主用户的最小传输速率未被满足时的惩罚项δj为: 其中,为第j个次级用户在第n个时隙时的传输速率,Rmin为第j个主用户的最小传输速率需求;所述当训练回合的步数达到本次训练回合的总步数时,更新AC算法网络参数和DDPG算法网络参数中,所述更新AC算法网络参数包括:AC算法的评估网络生成AC算法的当前价值;根据当前子频段智能体的输入状态信息和AC算法中动作网络的动作输出,确定AC算法的动作网络的策略梯度;根据AC算法的动作网络的策略梯度和子频段智能体的即时奖励,确定AC算法的目标价值;根据AC算法的当前价值和目标价值,确定AC算法的TD误差;根据AC算法的动作网络的策略梯度,利用梯度上升策略更新动作网络参数,根据AC算法的TD误差,利用梯度下降策略更新评估网络参数;所述AC算法的动作网络的策略梯度为: 其中,为优势函数,为AC算法的动作网络;为AC算法中动作网络的输出,为子频段智能体的输入状态,ξ为AC算法中动作网络的动作网络参数;所述AC算法的目标价值yk为: 其中,rn+1为子频段智能体的即时奖励,γ1为AC算法的折扣因子,为AC算法的当前价值,ω为AC算法中评估网络的评估网络参数;所述AC算法的TD误差为: 所述利用梯度上升策略更新动作网络参数为: 其中,αa为动作网络的学习率参数;所述利用梯度下降策略更新评估网络参数为: 其中,αc为评估网络的学习率参数;所述当训练回合的步数达到本次训练回合的总步数时,更新AC算法网络参数和DDPG算法网络参数中,更新DDPG算法网络参数包括:DDPG算法的目标评估网络输出当前值;根据认知无人机的状态信息和DDPG算法中动作网络的动作输出结果,确定DDPG算法的确定性策略梯度;根据认知无人机的即时奖励和目标评估网络的当前值,确定DDPG算法的目标值;根据目标评估网络的当前值和DDPG算法的目标值,确定DDPG算法的TD误差;根据DDPG算法的TD误差,利用梯度下降的算法更新DDPG评估网络的网络参数;根据DDPG评估网络的网络参数,利用软更新策略更新DDPG目标动作网络的网络参数和目标评估网络的网络参数;所述DDPG算法的确定性策略梯度为: 其中,Ntr为样本批次大小,为认知无人机的输入状态,为DDPG算法中动作网络的输入值;为输入值为时,DDPG算法中评估网络的输出,为DDPG算法中动作网络参数,λ为DDPG算法中动作网络的网络参数;所述DDPG算法的目标值yi为: 其中,ri+1为认知无人机的即时奖励;γ2为DDPG算法的折扣因子,为DDPG算法中目标评估网络的输出,λ-为目标评估网络的网络参数,为目标动作网络的网络参数;所述DDPG算法的TD误差为: 其中,为输入值为时,DDPG算法中评估网络的输出; 为DDPG算法中动作网络的输出值; 其中,η服从高斯分布的噪声方差;所述利用梯度下降的算法更新DDPG评估网络的网络参数λ为: 其中,βc为DDPG算法中评估网络的学习率参数;所述利用软更新策略更新DDPG目标动作网络的网络参数和目标评估网络的网络参数为: 其中,τ为控制软更新策略的频率因子。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:211106 江苏省南京市江宁区将军大道29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。