南京大学章宗长获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学申请的专利基于队友感知的多智能体协作通信策略的训练系统和方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114757092B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210297894.X,技术领域涉及:G06F30/27;该发明授权基于队友感知的多智能体协作通信策略的训练系统和方法是由章宗长;俞扬;周志华;张福翔;袁雷;王铖鹤;秦熔均设计研发完成,并于2022-03-24向国家知识产权局提交的专利申请。
本基于队友感知的多智能体协作通信策略的训练系统和方法在说明书摘要公布了:本发明公开了提出一种基于队友感知的多智能体协作通信策略的训练系统和方法,借助于队友建模方法,在与队友交互的过程中,为队友生成定制化、稀疏化的消息。通过多智能体强化学习通信方法,使得智能体能够在带宽受限的条件下学得能够抗干扰的高效协作通信策略,训练得到的智能体协作通信策略可以使智能体既能根据自身得到的观测信息选择合理的协作动作,又能够在合适时刻向队友发送信息以促进协作,或根据收到的队友信息进行配合。本发明在带宽受限的实际场景中仅通过少量节点间的通信实现紧密有效的协作,能够保证多智能体协作通信过程中的抗干扰能力。
本发明授权基于队友感知的多智能体协作通信策略的训练系统和方法在权利要求书中公布了:1.一种基于队友感知的多智能体协作通信策略的训练系统,其特征在于,系统构建智能体仿真操控环境进行多智能体协作通信策略的训练,包括三个模块: 个体值网络模块,用于从自身观测中判断动作价值; 分布式队友建模模块,用于从自身历史信息中进行队友建模; 信息生成模块,用于生成稀疏且具有针对性的队友信息; 所提出的三个模块能够以端到端的方式通过强化学习方法进行同时训练; 所述个体值网络模块使用全连接神经网络表示,能够根据给定的观测信息得到单步智能体控制过程下的最优动作及其最大回报;在训练阶段中,该模块利用结合场景中所有队友个体值网络的混合网络,使用深度Q网络的经验回放方法进行学习,利用训练过程中与智能体仿真操控环境交互过程中的历史数据,根据贝尔曼方程进行网络参数更新,得到较优的网络模型; 所述分布式队友建模模块根据历史观测信息和队友编码信息,将对应队友建模为一个多维高斯分布,并利用该高斯分布采样得到的向量作为队友表征,用于信息生成;该模块除上述端到端的强化学习目标函数外,额外引入一个基于互信息的目标,以保证队友建模的准确性; 所述信息生成模块能够根据分布式队友建模模块得到的队友信息,综合自身观测,对不同的智能体队友生成针对性信息;该信息生成模块使用自注意力网络综合自身观测信息和队友建模信息,得到对于不同队友的不同权重,并根据权重大小选择性地与部分队友进行通信,为使通信目标更为稀疏,所述信息生成模块额外引入基于信息熵的优化目标,使得智能体信息生成模块能够在通信时主要考虑少数重要目标;信息生成模块能够生成与对应动作相同维度的信息,智能体在每个时间步获取可用的通信信息后将其与自身个体值网络的输出直接加和,避免了个体值网络需要对信息的额外处理。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励