Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 电子科技大学任婧获国家专利权

电子科技大学任婧获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉电子科技大学申请的专利基于多智能体强化学习的分布式WSN能量效率路由优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117014988B

龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310762750.1,技术领域涉及:H04W40/04;该发明授权基于多智能体强化学习的分布式WSN能量效率路由优化方法是由任婧;郑建功;宋彤雨;郭孝通;王晟;王雄;徐世中设计研发完成,并于2023-06-26向国家知识产权局提交的专利申请。

基于多智能体强化学习的分布式WSN能量效率路由优化方法在说明书摘要公布了:本发明公开了一种基于多智能体强化学习的分布式WSN能量效率路由优化方法,分布式地在每个传感器节点部署具有决策模块的智能体,构建路由协作决策系统,所有智能体采用同步决策的方式,每个智能体的决策模块周期性地根据本地观察值向量和位置向量在本地计算得路由策略向量;决策模块采用多智能体强化学习算法进行训练,然后对无线传感网络进行部署,部署完成后周期性地采用路由协作决策系统更新路由方案。本发明综合考虑能量消耗和能量均衡性,以完全分布式的方式实现数据包的无环转发路径联合规划,提高网络存活时间。

本发明授权基于多智能体强化学习的分布式WSN能量效率路由优化方法在权利要求书中公布了:1.一种基于多智能体强化学习的分布式WSN能量效率路由优化方法,其特征在于,包括以下步骤: S1:对于拟部署的无线传感网络,记连接电源的汇聚节点为n0,由电池供电的传感器节点为ni,i=1,2,…,A,A表示由电池供电的传感器节点数量;对于每个传感器节点ni,将位于其通信范围内的其它节点集合作为其邻居节点集合每个传感器节点持续收集数据,在收集到关键数据时将数据打包发送到汇聚节点;数据包中携带一个历史路径字段,记录已经过的节点; 在每个传感器节点ni上部署一个搭载了决策模块的智能体ai,周期性进行路由策略向量决策,并基于路由策略向量分布式地为每个数据包的转发路径进行联合规划; S2:构建路由协作决策系统,包括A个决策模块,分别部署在每个传感器节点的智能体ai上;决策模块的决策间隔为τ秒,即每间隔τ秒进行一次路由策略的更新,生成一个基于概率的路由策略向量其中表示本次路由策略更新后传感器节点ni选择节点nj作为下一路转发节点的概率,j=1,…,A,t表示本次路由决策所在时刻;在两次决策间隔间,每当有数据包到达节点时,根据当前的路由策略向量采样选择下一跳转发节点;决策模块包括神经网络和修正模块,其中: 神经网络的输入为本地观察值向量和位置向量Posi,处理得到初步概率向量并发送给修正模块,其中表示本次初步路由决策中传感器节点ni选择节点nj作为下一跳转发节点的概率; 本地观察值向量的确定方法为:获取传感器节点ni在过去B1个决策间隔从环境中收集到的数据量其中b1=1,2,…,B1;获取传感器节点ni在过去B2个决策间隔作为中继节点为其它传感器节点转发的数据量其中b2=1,2,…,B2;获取传感器节点ni在当前时刻的剩余能量Wi,t;根据数据量数据量和剩余能量Wi,t的理论最大值对各个数据进行归一化,得到归一化后的数据量数据量和剩余能量其中,和分别表示数据量数据量和剩余能量Wi,t的理论最大值; 然后将归一化的各个数据拼接得到时刻t的本地观察值向量位置向量Posi的确定方法为:以汇聚节点为原点建立二维直角坐标系,传感器节点ni获取自身在此坐标系下的坐标位置分别表示横坐标和纵坐标;然后获取传感器节点ni和汇聚节点之间的距离disi,筛选得到A个距离disi中的最大值max_dis,据此对坐标位置进行归一化得到位置向量修正模块用于根据传感器节点ni的邻居节点集合对初步概率向量进行修正,并将修正后的概率向量作为路由策略向量,具体方法为: 根据邻居集合生成邻居掩码向量其中分量表示节点nj为节点ni的邻居,二者可以相互通信;如果节点nj不在节点ni的邻居范围内,此外,设置然后计算初步概率向量与邻居掩码向量的哈达玛积,得到路由策略向量最后,对路由策略向量进行归一化处理,每个概率分量归一化的具体计算公式为: S3:采用多智能体强化学习算法在仿真环境中对路由协作决策系统中的A个智能体ai的决策模块进行训练; S4:训练完成后对无线传感器网络进行部署,具体方法为: S4.1:按照预定义的部署位置将邻居节点信息写入各传感器节点的配置文件中; S4.2:按照预定义的部署位置在实际环境中部署各传感器节点; S4.3:每个传感器节点ni设置收集数据量计数器和转发数据量计数器并初始化其值为0,其中收集数据量计数器用于统计单个决策间隔内传感器节点ni发送的自己从环境中收集到的数据量,转发数据量计数器用于统计单个决策间隔内传感器节点ni作为中继节点转发的来自其它传感器节点的数据量; S4.4:部署在各传感器节点的智能体通过决策模块为每个传感器节点生成初始路由策略向量; S5:各传感器节点持续对环境进行监测,并接收其它传感器节点发送的数据,每当有数据包产生或到达时,根据数据包的历史路径字段和节点当前的路由策略向量进行下一跳转发节点的采样,并将数据包发送至下一跳转发节点;下一跳转发节点采样的具体方法为: S5.1:记当前数据包在系统中产生的序号为k,大小为lk,当前所到达节点为ni,根据历史路径字段生成转发掩码向量其中表示第k个数据包在到达节点ni时,尚未经过节点nj;表示第k个数据包在到达节点ni时,已经过节点nj; S5.2:计算节点ni当前的路由策略向量Pti与当前数据包的转发掩码向量的哈达玛积,得到路由采样向量路由采样向量屏蔽了路由策略向量中该数据包已经过的节点,避免采样的转发路径中出现路由环路; S5.3:将路由采样向量按照以下公式进行归一化: S5.4:智能体ai在0,1]范围内随机生成一个浮点数,判断其落在归一化后路由采样向量的概率累计分布函数的区间,将该区间所对应的概率值对应的节点作为该数据包的下一跳转发节点; S5.5:如果当前历史路径字段为空,则说明数据包由节点ni生成,则令收集数据量否则说明该数据包由其他节点生成,则转发数据量S5.6:将节点ni的id写入该数据包的历史路径字段中,表示已经经过节点ni; S5.7:节点ni将该数据包发送到所选择的下一跳转发节点S6:检查每个节点的剩余能量,判断是否有传感器节点能量耗尽,如果是,则判定网络瘫痪,路由决策结束,否则进入步骤S7; S7:判断距离上次决策是否已经经过τ秒,如果是,进入步骤S8,否则返回步骤S5; S8:每个智能体同步决策,更新其路由策略向量,具体方法为: S8.1:每个智能体ai分别获取对应传感器节点ni的收集数据量和转发数据量S8.2:将收集数据量计数器和转发数据量计数器置零; S8.3:每个智能体ai分别获取其当前的本地观察值向量和位置向量Posi并输入决策模块,得到路由策略向量返回步骤S5。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。