基于双深Q网络和冲突度算法的网络无冲突资源分配方法

导航：龙图腾网> 最新专利技术> 基于双深Q网络和冲突度算法的网络无冲突资源分配方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：重庆理工大学

摘要：本发明公开了一种基于双深Q网络和冲突度算法的网络无冲突资源分配方法，该方法将网络环境的用户干扰关系并构建单环多图模型，在无资源冲突的约束下，以整个网络资源重用率ρ最大化为目标，构建优化问题；接着，针对所述单环多图模型，将所述优化问题建模为马尔可夫决策过程；并构建资源分配模型，所述资源分配模型包括环境模块和DDQN网络模块，其中，环境模块用于模拟网络环境中的用户干扰关系；DDQN网络模块模块包括主网络和目标网络、重放存储器D、ε‑贪婪算法单元和损失函数计算单元；最后，根据DDQN算法和冲突度算法，选择最大动作值函数对应的动作，得到最优无冲突资源分配策略。本发明实现了无冲突和资源重用率最大化。

主权项：1.一种基于双深Q网络和冲突度算法的网络无冲突资源分配方法，其特征在于，包括以下步骤：步骤1：获取待进行资源分配的网络环境的用户干扰关系并构建单环多图模型，在无资源冲突的约束下，以整个网络资源重用率ρ最大化为目标，构建优化问题；步骤2：针对所述单环多图模型，将所述优化问题建模为马尔可夫决策过程，所述马尔可夫决策过程包括状态空间、动作空间、状态转移矩阵、即时奖励函数、策略和动作价值函数六个要素；步骤3：构建资源分配模型，所述资源分配模型包括环境模块和DDQN网络模块，其中，环境模块用于模拟网络环境中的用户干扰关系；DDQN网络模块包括主网络和目标网络、重放存储器D、ε-贪婪算法单元和损失函数计算单元；步骤4：根据DDQN算法和冲突度算法，选择最大动作值函数对应的动作，得到最优无冲突资源分配策略，步骤4具体包括：S41：初始化DDQN网络及其参数，包括初始化主网络权值w和目标网络权值θ，并选择初始动作a0及其初始状态s0；S42：在动作空间A中选择一个随机动作进行基于概率阈值εt的探索，或者以1-εt的概率选择一个使得动作价值函数最大的动作；S43：根据t时刻选择的动作at和状态st计算即时奖励rt，并得到下一时刻t+1时的扩展的关联矩阵Mat+1，其中，即时奖励rt是基于冲突程度得到的，即：其中，rst,at表示在st状态下选择动作at的环境奖励，DConflictt表示t时刻的冲突程度，即DConfiltvi,k表示用户vi使用资源k的冲突度，ρ为资源重用率；t+1时刻的扩展的关联矩阵Mat+1表示为：其中，Mt+1表示t+1时刻的单环多图模型对应的关联矩阵，Ekt+1表示t+1时刻用户的资源分配情况矩阵；S44：利用t+1时刻的扩展的关联矩阵Mat+1来获得t+1时刻的状态，即st+1＝Mat+1，并将当前体验et＝st,at,rt,st+1存入重放内存器D中；S45：从重放存储器D中随机选择一个体验，用于训练主网络的权重参数w，并按照设置的更新步长，更新目标网络中的参数θ＝w；S46：更新贪婪因子ε，即其中，εt表示t时刻的贪婪因子，即t时刻的概率阈值；εt+1表示t+1时刻的贪婪因子；εdecay表示设置的衰减因子；εmin表示设置的最小贪婪因子；S46：对于每次迭代，重复执行步骤S42-S46，直至迭代完成；S47：输出最终的网络权值w和目标网络权值θ，以及最优策略π*s,a。

全文数据：

权利要求：

百度查询：重庆理工大学基于双深Q网络和冲突度算法的网络无冲突资源分配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：电池单体、储能设备及用电装置

下一篇：写请求的处理方法、装置、设备和介质

相关技术

电池单体、储能设备及用电装置

写请求的处理方法、装置、设备和介质

一种可移动式预装变电站

一种齿轨车的制动方法、装置、设备及存储介质

一种紫外活化过一硫酸盐联用过程去除水中硫酸羟基氯喹的方法

一种基于固体废物的晶须增强免烧多孔陶瓷及其制备方法

一种多自由度解耦的波浪能发电装置及其工作方法

一种接地线缆开关状态检测装置和检测方法

一种基于企业资源的职业教育的管理方法以及设备

一种不等厚火山口玻璃后盖周抛方法

一种鞘管弹簧丝绕制装置

一种整车软件管理系统及方法

算法相关技术

基于TransUNet的肺结节分割算法_北京理工大学唐山研究院_202410893732.1

基于纹理的自动曝光控制算法_元平台技术有限公司_202410267708.7

互校验半监督的肺结节分割算法_北京理工大学唐山研究院_202410893985.9

用于存储器装置的读取算法_美光科技公司_202180049882.9

基于遗传算法的航空电缆布局优化方法_极采贸易(上海)有限公司_202410711139.0

基于多算法交互的数据采集方法及其系统_福建雄溪技术有限公司_202410755483.X

一种分析计算牛羊疾病行为的算法_深圳市在那科技有限公司_202410622199.5

听力装置的运行方法及基于用语音可懂度预测算法优化的算法提供语音增强的听力装置_奥迪康有限公司_201910045585.1

一种基于智能算法的深基坑边坡预警方法_青岛地质工程勘察院(青岛地质勘查开发局)_202410778691.1

一种基于神经网络算法的网络数据入侵检测方法_广西电网有限责任公司_202410708304.7

冲突相关技术

上下行传输冲突解决方法、装置及存储介质_北京小米移动软件有限公司_202080000285.2

产品全生命周期设计冲突量化和消解方法及系统_山东大学_202411088269.X

基于类重定位的类冲突解决方法及系统_浪潮软件科技有限公司_202410805747.8

一种网约车司机冲突单检测的优化方法_首约科技(北京)有限公司_202111201251.2

基于潜在碰撞判定的自动驾驶车辆与行人冲突检测方法_哈尔滨工业大学_202311350051.2

一种基于博弈论的新型电力系统人机冲突消解方法_国网浙江省电力有限公司双创中心_202410425029.8

面向动作冲突的空间敌意目标规避区间松弛规划方法_哈尔滨工业大学_202410781377.9

网络发起的注销/分离与紧急服务冲突的UE行为方法_联发科技(新加坡)私人有限公司_202410213892.7

面向检索增强语言模型的知识冲突分析缓解方法_中国科学院自动化研究所_202410656522.0

基于路径冲突时间窗的单向环道多AGV优化调度方法_重庆大学_202210287347.3

网络相关技术

光纤开关传感网络_武汉世纪金桥安全技术有限公司_201710196035.0

网络系统_关连风科技股份有限公司_202410743150.5

网络辅助信息_高通股份有限公司_202280090336.4

网络模块的压线工具_宁波登骐网络科技有限公司_202323211163.8

一种基于神经网络算法的网络数据入侵检测方法_广西电网有限责任公司_202410708304.7

网络策略生成、算力调度策略处理方法、装置及网络设备_大唐移动通信设备有限公司_202310252332.8

移动网络计算服务方法、装置及网络功能单元_中国移动通信有限公司研究院_202310226529.4

确认针对网络设备的新的网络设备软件的安装_瞻博网络公司_202310549251.4

一种网络变压器加工工艺及网络变压器_岳池县宇虹科技有限公司_202410565882.X

一种融合卷积神经网络和随机森林的网络入侵检测方法_西京学院_202410758598.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于双深Q网络和冲突度算法的网络无冲突资源分配方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务