一种用于兵棋推演平台的端云协同训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国人民解放军国防科技大学

摘要：本申请涉及一种用于兵棋推演平台的端云协同训练方法。所述方法包括：将推演用户端作为协同工作的用户端，推演服务器通过作为云端服务器构建端云协同框架；对端云协同框架进行建模，将用户端建模为智能体，得到端云协同模型；根据Decider算法和预先获取的离线数据集对端云协同模型进行离线预训练，根据离线数据子集对用户端进行在线训练，将训练得到的本地智能体模型上传至云端服务器；在云端服务器进行模型聚合，得到加权平均模型，作为当前轮次更新后的全局智能体模型，并广播至用户端。采用本方法能够提高兵棋推演平台训练准确率和效率。

主权项：1.一种用于兵棋推演平台的端云协同训练方法，其特征在于，所述方法应用于包括推演服务器和多个推演用户端的兵棋推演平台，所述方法包括：将所述推演用户端作为协同工作的用户端，所述推演服务器通过作为云端服务器，所述用户端通过云端服务器的接口与所述云端服务器进行数据共享和协同处理构建端云协同框架；对所述端云协同框架进行建模，将所述用户端建模为智能体，得到端云协同模型；根据Decider算法和预先获取的离线数据集对所述端云协同模型进行离线预训练，将得到的离线智能体对应的状态价值网络的网络参数和目标策略网络的网络参数及离线数据子集广播至推演用户端；根据所述离线数据子集和用户端在线收集的数据对所述用户端进行在线训练，设置用户端上本地智能体模型对应的动作网络的目标函数和评价网络的损失函数，利用所述本地智能体模型对应的动作网络的目标函数和评价网络的损失函数对所述本地智能体模型进行训练，将训练得到的本地智能体模型上传至云端服务器；在所述云端服务器的测试环境中利用所述训练得到的本地智能体模型输出的模型策略进行性能测试，根据不同模型策略对应的累计奖励值进行模型聚合，得到加权平均模型，作为当前轮次更新后的全局智能体模型，并广播至用户端。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学一种用于兵棋推演平台的端云协同训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：光检测装置

下一篇：大语言模型生成SQL查询语句中的数据权限控制方法及设备

相关技术

光检测装置

大语言模型生成SQL查询语句中的数据权限控制方法及设备

半导体用黏合膜、切割晶粒接合一体型膜及半导体装置的制造方法

一种流量计标定装置及标定方法

一种1-溴乙基乙酸酯的制备方法

适用于不同功能空间声场控制的音频处理系统及方法

电信网元实时处理方法、装置、设备、介质及程序产品

ZnO/石墨烯复合材料、Zn杂化石墨烯阻燃环氧丙烯酸酯涂层及制备方法

情感分类模型训练方法、系统、情感分类方法及系统

内走线鱼竿的摇柄隐藏结构

储能变流器及储能系统

一种铸造用固化剂及其制备方法和使用方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种用于兵棋推演平台的端云协同训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务