一种基于注意力机制的兵棋推演AI分层决策方法及装置

导航：龙图腾网> 最新专利技术> 一种基于注意力机制的兵棋推演AI分层决策方法及装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南京邮电大学

摘要：本发明公开了一种基于注意力机制的兵棋推演AI分层决策方法及装置，包括进行分层网络建模与强化学习智能体建模，获取到态势推演初始数据进行预处理；获通过智能体局部观察数据，输出当前所有智能体的总体目标；通过智能体局部观察数据和当前所有智能体的总体目标，输出当前所有智能体的当前应采取的决策；通过当前所有智能体的总体目标，筛选并预处理得到此刻的目标态势；利用注意力机制筛选出与目标态势关联最大的智能体局部信息，并进行态势评估；将当前所有智能体的当前应采取的决策输入到兵棋推演环境中，得到更新之后的新态势，通过所述新旧态势之间的差别计算奖励并训练网络，本发明能够有效的解决兵棋推演环境的动态性问题以及稀疏奖励问题，使AI能够实现自主决策，对不同的想定具有一定的适应能力与较高的胜率。

主权项：1.一种基于注意力机制的兵棋推演AI分层决策方法，其特征在于，包括：进行分层网络建模与强化学习智能体建模，基于强化学习智能体模型对从兵棋推演平台获取到态势推演初始数据进行预处理；通过预先获取的智能体局部态势数据输出当前所有智能体的总体目标；通过智能体局部态势数据和当前所有智能体的总体目标，输出当前所有智能体的当前应采取的决策；通过当前所有智能体的总体目标，筛选并预处理得到此刻的目标态势；通过当前的目标态势，利用注意力机制筛选出与目标态势关联最大的智能体局部信息，并进行态势评估；将当前所有智能体的当前应采取的决策输入到兵棋推演环境中，得到更新之后的新态势，通过所述新旧态势之间的差别计算奖励并训练网络；所述通过当前的目标态势，利用注意力机制筛选出与目标态势关联最大的智能体局部信息，并进行态势评估，其中包含管理层与执行层两个部分：所述管理层的评估部分包括将当前的目标态势输入到管理层的评估神经网络中，输出当前的总体态势评分；所述执行层的评估部分，包括：①每一个智能体拥有一个本地评估网络，通过输入当前的智能体态势信息得到本地评分；②将目标态势将与智能体的态势信息输入到多头注意力机制的编码层中；③因为智能体数量较多，并不是所有智能体都与当前目标相关，所以要对智能体信息进行筛选，通过注意力机制计算权重，获取与当前目标态势最为相关的智能体信息，公式为：（1）；将权重与智能体的本地评分加权求和，得到此刻执行层的总体态势评分，公式为：（2）。

全文数据：

权利要求：

百度查询：南京邮电大学一种基于注意力机制的兵棋推演AI分层决策方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种能够进行流量调节的流量压力控制阀

下一篇：一种星载TR组件功放芯片自动共晶焊接装置

相关技术

一种能够进行流量调节的流量压力控制阀

一种星载TR组件功放芯片自动共晶焊接装置

一种设有脚踏板组件的坐便椅

一种肉类风味制品加工装置

一种装配式建筑用预制墙板铝模孔洞成型结构

一种带有新型掩膜的硬质电路板

一种用于沥青混凝土生产的烘干装置

主板组件、机器人头部组件及机器人

一种膏贴剂生产用开孔装置

一种蛋白粉生产用过滤除杂装置

一种转鼓过滤机用卸料机构

3D打印内支撑条去除工具

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于注意力机制的兵棋推演AI分层决策方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务