Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国科学院计算技术研究所王琪获国家专利权

恭喜中国科学院计算技术研究所王琪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国科学院计算技术研究所申请的专利基于深度强化学习的实时分布式无线网络调度方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114173418B

龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111327838.8,技术领域涉及:H04W72/0446;该发明授权基于深度强化学习的实时分布式无线网络调度方法和系统是由王琪;何晨涛;黄建辉;徐勇军设计研发完成,并于2021-11-10向国家知识产权局提交的专利申请。

基于深度强化学习的实时分布式无线网络调度方法和系统在说明书摘要公布了:本发明提出一种基于深度强化学习的实时分布式无线网络调度方法和系统,包括:获取由多个接入点和用户节点组成的无线网络;在测试阶段的每个时隙,接入点根据部分数据流对应的发送队列信息,得到各数据流的状态,同时获取之前对无线信道的历史观测信息将数据流的状态和历史观测信息输入至决策模型,接入点执行决策模型输出结果对应的调度决策;在训练阶段,网络中存在的全局决策模型获取所有数据流的状态信息,并给出每个接入点的最优决策动作,接入点执行专家网络给出的最优决策动作,同时将部分数据流的状态,信道的历史观测信息,最优调度决策动作作为交互信息存储至各自的经验回放池中,从各自的经验回放池中抽取经验,训练更新当前决策模型。

本发明授权基于深度强化学习的实时分布式无线网络调度方法和系统在权利要求书中公布了:1.一种基于深度强化学习的实时分布式无线网络调度方法,其特征在于,包括:步骤1、获取由多个接入点和多个用户节点互连组成的无线网络,每个接入点调度网络中的部分数据流,每个接入点本地均设有的经验回放池;步骤2、每个接入点i与网络环境交互时,在训练阶段的每个时隙t,网络中全局专家网络收集所有数据流的状态信息、流量模型信息及链路质量信息,并给出每个接入点的最优调度决策动作,每个接入点i执行全局专家网络所给出的最优调度决策动作每个接入点i根据部分数据流对应的发送队列信息,得到接入点i所调度的数据流在t时隙的状态同时,获取之前截止时隙t对无线信道的历史观测信息将交互信息存储至接入点i本地的经验回放池中,在测试阶段的每个时隙t,每个接入点i将部分数据流的状态和历史观测信息输入至决策模型,该接入点执行该决策模型输出结果对应的调度决策步骤3、每个接入点i从本地的经验回放池中抽取经验,以训练更新接入点i的决策模型;其中该决策模型的训练过程包括:构建获取全局信息专家网络,该全局信息包括无线网络中所有数据流的状态信息、流量模型信息及链路质量信息,在每个时隙,该专家网络根据全局信息做出各接入点的最优调度决策,每个接入点执行所接收到的最优调度决策动作,同时将当前时隙下,接入点将其获得的历史观测信息、局部环境状态与最优调度决策动作,存入接入点本地的经验回放池中,每个接入点设有学徒网络,在每个时隙,接入点从本地的经验回放池中随机抽取批量经验用于更新该学徒网络的参数,直到该学徒网络输出的调度决策达到预设标准或达到预设更新次数,保存当前学徒网络作为该决策模型;该学徒网络包括长时序列网络和全连接神经网络,长时序列网络用于处理历史观测信息,全连接神经网络网络用来处理所调度的数据流的状态;其中该历史信息为接入点在各历史时隙监听到的数据包传输情况,数据包传输情况包括以下三种:没有任何数据包进行传输、发送节点成功发送数据包但该数据包没有被目的节点接收,以及发送节点成功发送数据包并被目的节点成功接收;基于下述损失函数更新第i个接入点的该学徒网络参数: 其中,pjc为学徒网络的输出,表示在输入为hj,sj的情况下采取调度动作c的概率,hj,sj分布为该批量经验中第j个历史信息和环境状态;yjc的值当动作c为最优动作时,yjc=1,否则yjc=0。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院计算技术研究所,其通讯地址为:100080 北京市海淀区中关村科学院南路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。