北京航空航天大学;哈尔滨工业大学王天博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京航空航天大学;哈尔滨工业大学申请的专利一种基于强化学习的网络对抗决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119966697B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510077248.6,技术领域涉及:H04L9/40;该发明授权一种基于强化学习的网络对抗决策方法是由王天博;梁霄鹏;王莘;李阳;赵缘设计研发完成,并于2025-01-17向国家知识产权局提交的专利申请。
本一种基于强化学习的网络对抗决策方法在说明书摘要公布了:本发明公开了一种基于强化学习的网络对抗决策方法,属于网络对抗的技术领域,根据网络对抗过程的特点,将网络对抗过程建模为部分可观测的马尔可夫决策过程,并利用网络环境状态转移的特性,通过图的无监督和自监督任务构建网络环境表征模型;结合网络环境表征模型、基于强化学习算法构建网络对抗决策模型,针对攻击和防御两种场景形成对应智能体,包括攻击方和防守方。并在网络对抗模拟环境中进行动态博弈,通过最大化回报不断提升网络对抗的决策质量;本发明采用上述方法,将网络对抗过程转化为部分可观测的马尔可夫决策问题,结合图神经网络、基于强化学习算法实现网络对抗的策略生成,通过智能体之间的动态博弈实现网络对抗策略的优化。
本发明授权一种基于强化学习的网络对抗决策方法在权利要求书中公布了:1.一种基于强化学习的网络对抗决策方法,其特征在于:包括以下步骤: S1:网络环境中,攻击方和防守方设置为智能体,通过马尔科夫性质的假设及网络对抗的特点,采用六元组定义网络环境的状态空间、智能体动作空间、状态转移概率、奖励函数、智能体观测空间、条件观测概率; S2:基于图神经网络建立网络环境表征模型,具体构建过程如下: S21:建立两个辅助任务,分别是图的重构与生成; 定义时刻网络环境的状态为该时刻的网络拓扑与节点特征构成的二元组,其中为节点数量,为特征维度,为网络的邻接矩阵,为所有节点的特征矩阵,智能体在时刻的观测表示为二元组,具体取值则依赖于预定义的条件观测概率; S22:网络环境表征模型包括图自编码器GAE和变分图自编码器VGAE,分别通过图的无监督任务和自监督任务实现神经网络的参数训练; S23:无监督任务为网络环境状态的重构,自监督任务根据马尔可夫的性质进行未来网络状态的生成; 训练过程中,令GAE的编码器与VGAE中负责生成均值的编码器共享图注意力层;当共享的编码器为两个时,定义GAE与VGAE共享的两个GAT层的参数分别为和,VGAE独有的GAT层的参数为; GAE的无监督任务通过重构邻接矩阵并最小化重构误差实现神经网络的参数训练,通过编码器生成网络环境的隐变量表示: ; 上式中,为参数为的GAT网络,为参数为的GAT网络,使用点积解码器得到重构的邻接矩阵,为激活函数: ; 是的转置矩阵,通过交叉熵损失函数计算真实的邻接矩阵与重构的邻接矩阵的差距,得到GAE的损失函数: ; 上式中,为的第行第列元素,为的第行第列元素,VGAE的自监督任务通过生成下一时刻的邻接矩阵并最大化变分推断的证据下界实现神经网络的参数训练,通过编码器生成隐变量的分布: ; ; ; ; 上式中,为动作的Embedding向量,为均值,为方差,为采样后的隐变量,为参数为的GAT网络,为正态分布; 从分布中采样得到隐变量,通过点积解码器得到生成邻接矩阵: ; 最后,计算VGAE的证据下界,得到VGAE的损失函数: ; ; 上式中,为权重,综合GAE与VGAE,网络环境表征模型整体的损失函数为: ; 上式中,表示权重; S24:通过上述步骤,设置损失函数阈值,得到训练好的网络环境表征模型,其中,GAE编码器接受零填充向量和观测作为输入,经过参数为和的图神经网络,生成网络表征; S3:结合网络环境表征模型,构建网络对抗决策模型作为攻击方和防守方; S4:攻击方和防守方通过动态博弈过程,对相应的网络对抗决策模型优化; S5:将优化好的攻击方和防守方的模型输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学;哈尔滨工业大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励