一种基于强化学习模型的机器人群体协调方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国人民解放军国防科技大学

摘要：本发明公开了基于强化学习模型的机器人群体协调方法，包括以下步骤：每个机器人被隐马尔科夫模型分配角色；机器人i将历史观测和动作编码成机器人i轨迹τi，来自机器人i和轨迹τi的观测值被送入强化学习网络；所述强化学习网络为角色分配效用矩阵，对效用矩阵进行张量环分解后，动态调整秩的大小，以优化单个机器人的局部效用；单个机器人的局部效用优化之后，所述强化学习网络对机器人i轨迹τi局部观测通过误差正则项和惩罚正则项进行优化；每个机器人根据优化后的局部观测做出独立决策。本申请动态调整张量秩的大小，使得单个无人机的局部效用得到优化；对无人机通过全局信息对局部观测优化，从而对无人机进行统一协调。

主权项：1.一种基于强化学习模型的机器人群体协调方法，其特征在于，包括以下步骤：每个机器人被隐马尔科夫模型分配角色；机器人i将历史观测和动作编码成机器人i轨迹τi，来自机器人i和轨迹τi的观测值被送入强化学习网络；所述强化学习网络为角色分配效用矩阵，对效用矩阵进行张量环分解后，动态调整秩的大小，以优化单个机器人的局部效用；单个机器人的局部效用优化之后，所述强化学习网络对机器人i轨迹τi局部观测通过误差正则项和惩罚正则项进行优化；每个机器人根据优化后的局部观测做出独立决策。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学一种基于强化学习模型的机器人群体协调方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种轮式翻抛机的箱梁结构

下一篇：一种压缩空气储能系统

相关技术

一种轮式翻抛机的箱梁结构

一种压缩空气储能系统

一种预制菜保鲜运输箱

一种基于双边模糊集的三支决策疾病分类方法及装置

一种废旧电池回收系统及其回收方法

一种分捡操作设备

全塑壳防静电吹尘枪

一种散热盘管焊缝位置打磨抛光装置

一种通风柜附属储物柜

一种伸缩万向联轴器

一种新型动盖板

一种取料手套箱、取料系统

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于强化学习模型的机器人群体协调方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务