首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多层聚合上下文MAB的链路决策方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京理工大学;中国电子科技集团公司第五十四研究所

摘要:本发明属于链路选择及通信数据传输技术领域,涉及一种基于多层聚合上下文MAB的链路决策方法。所述方法包括:S1、收集通信资源块与地面节点的链路信息并进行编码、整合及归一化得到特征向量,构建虚拟通信链路集合;S2、构建链路组合上下文特征向量再聚合得到簇中心及空地节点链路组合簇;通过上下文‑MAB模型估计预期收益,得到空地节点最优链路组合;S3、通过多用户贪心算法模型,为空地节点最优链路组合选择最佳通信参数组合;通过识别最优链路组合所属空地节点链路组合簇减少手臂数,转至S1进行下一轮决策。所述方法使复杂度降低、决策收益提升、学习效率与收敛速度提高。

主权项:1.一种基于多层聚合上下文MAB的链路决策方法,其特征在于:依托的链路决策系统,包括数据中心、空中节点与地面节点;所述数据中心分别与空中节点与地面节点相连,接收空中节点中通信资源块与地面节点的链路信息;所述地面节点为N个;空中节点为M个且每个空中节点有C个为空中节点特有的通信资源块;所述通信资源块表示可分配的通信资源,随具体的通信方式变化;一次通信中,1个地面节点占用该地面节点对应空中节点中的1个通信资源块;M个空中节点与N个地面节点之间的虚拟通信链路集合;虚拟通信链路集合中链路组合的数量取决于地面节点数量与空中节点资源块的数量;所述链路组合的数量为PMC,N;其中,PMC,N为在MC个元素中取N个元素进行排列的数目;所述虚拟通信链路集合包括所有空中节点与地面节点的链路组合;所述链路组合一端是通信资源块,一端是地面节点;若虚拟通信链路集合中某链路组合被选定,则该链路组合对两端的空中节点与地面节点会进行信息收发;所述基于多层聚合上下文MAB的链路决策方法,具体包括如下步骤:S1、数据中心收集通信资源块与地面节点的链路信息,并对收集的链路信息进行编码、整合及归一化得到通信资源块与地面节点的特征向量,构建虚拟通信链路集合;S2、构建第一层MAB决策模型,基于S1得到的通信资源块与地面节点的特征向量构建链路组合上下文特征向量,对链路组合上下文特征向量进行聚合,得到簇中心以及空地节点链路组合簇;S3、基于S2构建的第一层MAB决策模型,遍历S1得到的虚拟通信链路集合中的链路组合,基于链路组合的上下文特征向量估计该链路组合的预期收益并进行排序,得到空地节点最优链路组合,具体包括如下子步骤:S31、将虚拟通信链路集合中的链路组合作为MAB中的手臂,计算各链路组合的预期收益;S32、根据S31得到的各个链路组合的预期收益,将S1得到的虚拟通信链路集合中的链路组合按从大到小排序,得到排序后的空地节点链路组合;S33、选择MC和N中小的作为所需链路组合数;S34、将S32得到的排序后的空地节点链路组合作为可选链路组合,遍历可选链路组合,并判断待选链路组合可否被选择,更新可选链路组合,直至选出所需链路组合数数目的链路组合,得到空地节点最优链路组合;所述判断待选链路组合可否被选择,具体为:判断以当前待选链路组合对应的空中节点开始的链路组合被选择个数是否小于C,只有小于C,才能继续选择最优链路组合中以该空中节点开始的链路组合,否则跳过当前待选链路组合,并更新可选链路组合;所述待选链路组合为遍历排序后的空地节点链路组合过程中遍历指针依次指向的链路组合;所述更新可选链路组合具体为:在可选链路组合中删除以当前链路组合对应的空中节点开始的链路组合;至此,通过S3,得到了空地节点最优链路组合;S4、基于S2得到的空地节点链路组合簇构建第二层MAB决策模型,完成对S3得到的空地节点最优链路组合的最佳通信参数组合的选择,并观测最佳通信参数组合应用到最优链路组合的真实收益,具体包括如下子步骤:S41、构建虚拟链路参数性能表,具体为:为S2得到的空地节点链路组合簇的各个簇中心对应的链路组合遍历所有通信参数组合,观测所有通信参数的组合在各个簇中心对应的链路组合上应用的真实收益,虚拟链路参数性能表索引为簇中心对应链路组合与不同通信参数组合值为其真实收益;所述真实收益为某链路组合应用了某通信参数组合的链路组合达到的最大吞吐率;若最大吞吐率大于设定最低吞吐率,真实收益为1,否则真实收益为0;其中,最低吞吐率为地面节点正常工作所需最低数据速率;所述通信参数组合,表示为:[编码方式,调制方式,接入方式,调制参数];所述编码方式为编码或无编码;所述调制方式为单载波、FDM或OFDM,所诉接入方式为OMA或NOMA;所述调制参数,包括调制频率、幅度及占空比;所述通信参数组合中编码方式、调制方式和接入方式各取1种;所述通信参数组合中的调制参数包括调制频率、幅度及占空比的值;S42、遍历S3得到的空地节点最优链路组合,为其中每个链路组合选择最佳通信参数组合,并提取当前空地节点最优链路组合所属空地节点链路组合簇簇中心作为归属簇中心;在S41得到的虚拟链路参数性能表中查找归属簇中心应用不同通信参数组合的真实收益,得到最佳通信参数组合收益排序;S43、将不同通信参数组合作为手臂,将S42得到的最佳通信参数组合收益排序中真实收益最高的一组参数组合作为第二层MAB决策模型中的exploit手臂,将所有参数组合中与exploit手臂仅有两项不同的参数组合作为第二层MAB决策模型中的explore手臂集;S44、对exploit手臂与explore手臂集进行探索与利用,选择出该轮次的通信参数组合;至此,完成了对S3得到的空地节点最优链路组合的最佳通信参数组合的选择;S45、观测最佳通信参数组合应用到当前最优链路组合的真实收益;S5、将最优链路组合对应的上下文特征向量及最优链路组合在该轮决策中的真实收益加入历史收益记录,转至S1,进行下一轮决策。

全文数据:

权利要求:

百度查询: 北京理工大学 中国电子科技集团公司第五十四研究所 一种基于多层聚合上下文MAB的链路决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。