Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西安电子科技大学郑阳获国家专利权

西安电子科技大学郑阳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西安电子科技大学申请的专利基于多智能体强化学习的分布式TDMA时隙分配方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119997209B

龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510064608.9,技术领域涉及:H04W72/0446;该发明授权基于多智能体强化学习的分布式TDMA时隙分配方法是由郑阳;周启宇;盛敏;李建东;史琰;刘俊宇设计研发完成,并于2025-01-15向国家知识产权局提交的专利申请。

基于多智能体强化学习的分布式TDMA时隙分配方法在说明书摘要公布了:本发明提出了一种基于多智能体强化学习的分布式TDMA时隙分配方法,主要解决现有技术在高负载条件下节点无时隙可分配,导致移动自组织网络性能不佳的问题,方案包括:1构造移动自组织网络场景;2根据网络场景确定TDMA的帧结构;3利用网络场景和帧结构建立移动自组织网络仿真平台,获取性能指标;4将每个节点对应一个智能体,构建强化学习模块;5利用仿真平台和强化学习模块训练MADDPG模型,获取参数文件;6加载训练好的参数,利用模型实现时隙预测。本发明通过引入多智能体强化学习,结合优先经验回放和探索机制,有效提高时隙分配效率、提升了系统的吞吐量,从而实现增强移动自组织网络整体性能的提升。

本发明授权基于多智能体强化学习的分布式TDMA时隙分配方法在权利要求书中公布了:1.一种基于多智能体强化学习的分布式TDMA时隙分配方法,其特征在于,实现步骤包括如下: 1构造移动自组织网络场景,包括节点、拓扑结构、流量模型; 2根据构造的移动自组织网络场景确定TDMA的帧结构,根据如下方式确定:将一个超帧划分为N个帧,其中第一个帧为抢占帧,后面N-1个为信息帧;再将一帧划分为Q个时隙,且每一时隙包括P个时隙片,每一个时隙片持续时间为1ms,即一个超帧的持续时间为N*Q*P毫秒;设置每个节点的基础时隙片为N-1,即每个节点最少分配N-1个时隙片; 3利用移动自组织网络场景和TDMA帧结构,构建移动自组织网络仿真平台,获取网络性能指标; 4将每个节点对应一个智能体,设计状态空间、动作空间、奖励函数以及网络结构,构建强化学习模块;并使用Socket建立强化学习模块与移动自组织网络仿真平台进行数据传输的通信模块;所述设计状态空间、动作空间、奖励函数以及网络结构,构建强化学习模块,实现步骤如下: 4.1设计包含四维数据的状态空间,所述四维数据为节点上一时刻的吞吐量、上一时刻的时隙数、节点当前的负载、当前节点两跳以内的每个节点吞吐量总和; 4.2根据步骤2的帧结构,每个节点最大可分配的时隙片数为,是一个离散的值,将动作空间设计为维度的离散值; 4.3将系统整体吞吐量和公平性参数加权作为强化学习系统的奖励函数;假设为第个节点的吞吐量,为第个节点的权重,所述公平性参数表示如下: , 其中F数值越大表示公平性越好; 全局奖励函数可表示为: , 其中为公平性参数的权重值,代表系统整体吞吐量与公平性参数的比值; 4.4使用MADDPG模型的结构作为强化学习的主要框架构建强化学习模块的网络结构,对其进行训练,并使用优先经验回放方法进行样本生成与提取; 5利用构建的仿真平台和强化学习模块训练多智能体深度确定性策略梯度MADDPG模型,获取训练好的MADDPG模型参数文件; 6加载训练好的MADDPG模型参数文件,利用该模型实现移动自组织网络的TDMA时隙预测。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市雁塔区太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。