基于多智能体分层强化学习的协同自主网络防御决策方法

导航：龙图腾网> 最新专利技术> 基于多智能体分层强化学习的协同自主网络防御决策方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：广西科技大学

摘要：本发明涉及自主网络防御技术领域，具体涉及基于多智能体分层强化学习的协同自主网络防御决策方法，本发明通过多智能体分层强化学习方法演化博弈，实现动态均衡，该方法能够实时协调感知、恢复和诱捕防御行为，动态调整防御策略，从而能够解决在复杂时变网络空间中理性动态制定防御策略；引入的多智能体分层强化学习方法，通过解耦复杂决策空间，形成两层多选择头的防御智能体决策过程，这种方法能够提高决策效率，应对复杂网络环境中的问题，有助于减少潜在的网络风险和损失，实现实时弹性防护网络资产，从而解决在复杂时变网络空间中理性动态制定防御策略和弹性防护网络资产的问题。

主权项：1.基于多智能体分层强化学习的协同自主网络防御决策方法，其特征在于，包括以下步骤：基于真实网络攻防态势约束建立斯塔克伯格网络攻防博弈模型；设计所述博弈模型下博弈者的效用函数，推导该效用下的纳什均衡形式；建立动态博弈效用均衡与反馈强化学习的耦合机制，迭代演化效用，生成序贯纳什均衡；基于所述序贯纳什均衡建立多智能体分层强化学习求解器，形成两层多选择头的防御智能体决策过程；基于所述防御智能体决策过程训练模型联动多类型防御设施，动态调整防御策略，协同不同防御动作生成合作防御策略。

全文数据：

权利要求：

百度查询：广西科技大学基于多智能体分层强化学习的协同自主网络防御决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种批量热浸镀锌铝镁浸镀前两步式活化助镀处理方法

下一篇：一种新能源汽车语音功能测试方法、系统及设备

相关技术

一种批量热浸镀锌铝镁浸镀前两步式活化助镀处理方法

一种新能源汽车语音功能测试方法、系统及设备

一种行星齿轮减速机

一种高速机械磨削主轴加工装置

一种铝基制冷散热片及其制备方法

写请求的处理方法、装置、设备和介质

一种基于企业资源的职业教育的管理方法以及设备

一种基于固体废物的晶须增强免烧多孔陶瓷及其制备方法

一种观赏树木运输种植装置及运输车

一种1,2,3-三氮唑-4-甲酸乙酯的合成方法

一株马立克病病毒双基因编辑缺失疫苗株SD01ΔmeqΔM11及构建和应用

一种家具耐用性综合测试平台及其测试方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于多智能体分层强化学习的协同自主网络防御决策方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务