恭喜电子科技大学杜鸿飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜电子科技大学申请的专利一种联合内在动机探索的多智能体内在动机框架获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118780314B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410973982.6,技术领域涉及:G06N3/006;该发明授权一种联合内在动机探索的多智能体内在动机框架是由杜鸿飞;杨智友;谢宁;申恒涛设计研发完成,并于2024-07-19向国家知识产权局提交的专利申请。
本一种联合内在动机探索的多智能体内在动机框架在说明书摘要公布了:本发明公开了一种联合内在动机探索的多智能体内在动机框架,提出了联合内在动机探索算法JIME;JIME包括两个组件:一个用于压缩多智能体联合观察的编码器和一个用于预测智能体联合动作的解码器;首先将环境状态输入到编码器,得到从生成然后将输入到解码器,得到预测的动作最后计算损失函数,通过反向传播算法更新编码器和解码器的参数,最小化总损失,得到最终的JIME。本发明提供了一种新的内在动机探索方法,通过整合两种奖励类型来增强QMIX算法,能够解决给定任务的智能代理学习策略的联合内在动机探索的多智能体内在动机框架。
本发明授权一种联合内在动机探索的多智能体内在动机框架在权利要求书中公布了:1.一种联合内在动机探索的多智能体内在动机训练方法,其特征在于,提出了联合内在动机探索算法,即JIME;JIME包括两个组件:一个用于压缩多智能体联合观察的编码器和一个用于预测智能体联合动作的解码器;编码器提取并压缩环境状态s中的信息,解码器还原出智能体所做的决策a;编码器包含3层全连接神经网络,激活函数为Relu;解码器包含3层全连接神经网络,激活函数为Relu;在每次训练迭代中,首先将环境状态输入到编码器,得到和输入数据是智能体的观测状态,包括采集到的图像或传感器数据;表示在时间步t时智能体n映射到z的均值,压缩信息z通过编码器提取并压缩环境状态s中的信息得到;表示在时间步t时智能体n映射到z的协方差;使用重新参数化的技巧从和生成然后将输入到解码器,得到预测的动作最后计算损失函数,通过反向传播算法更新编码器和解码器的参数,最小化总损失,得到最终的JIME;JIME的损失函数如下: 其中,θ为JIME的参数,和是从交互式样本中取样的,分别为原始的环境状态和动作;为编码器,为解码器的输出,为正态分布。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。