Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜大连理工大学刘洋获国家专利权

恭喜大连理工大学刘洋获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜大连理工大学申请的专利一种基于深度强化学习的节能多智能体探索系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119761220B

龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510258711.7,技术领域涉及:G06F30/27;该发明授权一种基于深度强化学习的节能多智能体探索系统是由刘洋;张鹏;赵洁;王栋;卢湖川;张平平设计研发完成,并于2025-03-06向国家知识产权局提交的专利申请。

一种基于深度强化学习的节能多智能体探索系统在说明书摘要公布了:本发明属于人工智能、多智能体系统、深度强化学习以及自主探索领域,公开一种基于深度强化学习的节能多智能体探索系统,包括场景建模、效率导向观察系统、代理间策略网络、序列决策机制模块和等待机制。本发明提出的效率导向观察系统通过构建连接图和交互图的双重结构,并为节点附加探索值、距离特征、复杂度信息等多维协作导向特征,使系统能精确把握环境特征和智能体间的交互关系,显著提升多智能体系统的协同效率。本发明设计的序列决策机制模块结合了序列决策机制和等待机制,通过让智能体参考前序智能体的决策并在适当时候选择等待,避免了盲目协作造成的能源浪费。

本发明授权一种基于深度强化学习的节能多智能体探索系统在权利要求书中公布了:1.一种基于深度强化学习的节能多智能体探索系统,其特征在于,该节能多智能体探索系统包括场景建模、效率导向观察系统、代理间策略网络、序列决策机制模块和等待机制;(1)场景建模将待探索的场景定义为尺寸为的二维占用栅格地图,其包含已探索区域和未探索区域,满足;已探索区域进一步分为自由区域和占用区域,满足;每个智能体配备有探测范围为的激光扫描仪,用于更新已探索区域;在探索开始时,;节能多智能体探索系统的优化目标是寻找最短的智能体轨迹以完成整个区域的探索过程,同时确保探索过程中的能源效率和协作性能;(2)构建效率导向观察系统先构建连接图,用于刻画环境的连通性;在已探索区域中均匀采样,建立节点集合,并基于无碰撞路径为每个节点与其个最近邻居节点建立边集合;连接图随着时间动态更新,智能体根据连接图中邻居节点的特征选择下一步动作;为强化智能体间的协作关系,进一步构建交互图,其节点集合与连接图一致,边集合为动态连接智能体的当前位置节点和具有非零探索值的目标节点,形成逻辑无向图;在表征各节点探索价值的特征中,复杂度信息是关键特征,用于量化区域的探索难度和潜在协作需求;复杂度信息通过密度聚类算法对节点对应的边界点进行聚类计算得到,反映区域内的分叉结构及探索复杂程度;(3)构建代理间策略网络,通过注意力机制提升智能体的认知与决策能力,包含两个编码器和一个解码器;两个编码器并行地从连接图和交互图中提取节点信息;均由6层多头自注意力层组成,其中上层多头自注意力层输出的结果成为下层多头自注意力层的输入;每个多头自注意力层的输入包括查询向量、键向量和值向量,通过学习矩阵、、生成,、、为随机初始化的可迭代参数;权重由查询向量与键向量的点积计算并经尺度因子归一化后,通过softmax函数处理得到;为确保无边连接的节点无信息传递,引入掩码矩阵,当节点和节点之间存在边时,否则;连接图和交互图并行通过两个编码器后,分别输出的和被拼接并投影到维特征空间,生成增强节点特征;解码器由一层注意力层和一层指针层组成,通过多阶段处理生成动作概率分布;先从增强节点特征中提取当前节点特征和邻居特征,将前节点特征作为查询,增强节点特征作为键和值输入注意力层;注意力层生成的输出与前节点特征拼接后投影为当前增强特征;最终通过指针层生成动作概率分布,其中当前增强特征作为查询,作为键和值;指针层动态调整动作空间,输出策略分布,表示时刻选择下一个节点的概率,其中表示时刻对应的环境观测,分别表示时刻的决策点、时刻所在节点和时刻所在节点的所有邻点;(4)序列决策机制模块,将多智能体的动作分解为一系列有序的决策过程;在解码器的指针层的输入中,智能体的当前增强特征由前序动作进一步被增强,其中,对于智能体,节能多智能体探索系统将其前序智能体在时刻选择的增强目标节点特征序列与解码器输出的当前增强节点特征进行拼接,此处,为第个智能体的,;拼接后的特征通过一个维度为的二维卷积层处理将其降维回统一维度,其中表示节能多智能体探索系统中智能体的总数,表示特征维度;最后,将卷积层的输出作为新的输入指针层,以整合前序动作信息;(5)等待机制,通过动态调节智能体的行为状态,实现探索资源的合理分配和多智能体的高效协作。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116000 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。