中国人民解放军军事科学院战争研究院梁东晨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军军事科学院战争研究院申请的专利基于强化学习和遗传算法的智能体行为树生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116932535B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211734929.8,技术领域涉及:G06F16/22;该发明授权基于强化学习和遗传算法的智能体行为树生成方法及系统是由梁东晨;李朋;曹江设计研发完成,并于2022-12-30向国家知识产权局提交的专利申请。
本基于强化学习和遗传算法的智能体行为树生成方法及系统在说明书摘要公布了:本发明提出了基于强化学习和遗传算法的智能体行为树生成方法及系统,属于人工智能技术领域。将遗传算法生成的子代行为树加入强化学习的动作空间。使用强化学习调用生成的行为树驱动智能体,将强化学习对行为树的价值估计作为衡量适应度的参考。遗传算法根据适应度对行为树进行子代的筛选、重组和变异,反复迭代该过程,直到获得能够驱动智能体完成任务目标的行为树。由此实现在仅提供延迟奖励的实验环境下,即可生成能够驱动智能体完成任务目标的行为树。本发明为游戏智能体、机器人、无人车等多种应用提供自动生成由行为树表达的控制策略,减少了成本。
本发明授权基于强化学习和遗传算法的智能体行为树生成方法及系统在权利要求书中公布了:1.基于强化学习和遗传算法的智能体行为树生成方法,其特征在于,针对虚拟仿真系统,该系统覆盖多种地形要素,包括山地、沙地、河流、桥梁、丛林,其中有一个能够自由移动的小车,它通过模拟的雷达寻找目标物体,并且能够旋转炮管、发射炮弹,来对目标进行打击;小车的任务是从地图中的某一点开始,通过移动找到目标物体,并开炮击中它;仿真环境负责判断是否击中、是否超时,并且当任务成功或失败后重置游戏环境; 包括以下步骤: 步骤1:初始化行为树库; 设计一组行为树,每个行为树能够驱动小车完成基本的动作,覆盖仿真环境所有可能用到的逻辑、条件和动作节点,作为行为树库; 步骤2:初始化动作空间; 利用行为树库中的节点,随机生成若干个行为树,作为强化学习的初始动作空间; 步骤3:重置累加的价值估计,设置一个与动作空间大小相等的表,重置为0; 步骤4:进行强化学习训练; 使用强化学习进行一次训练迭代,以环境信息为输入,以对动作空间中行为树的价值估计为输出,选择价值最高的行为树进行实验,根据环境给的奖励值,更新对行为树的价值估计; 每次迭代,环境信息维度为3,是当前小车的坐标值x,y,z;输出的价值估计维度与动作空间大小相同,对应每一个行为树,选择价值最高的行为树进行测试;每当一个行为树结束执行,从环境获取奖励值;根据奖励值,更新对行为树的价值估计; 步骤5:判断行为树是否能完成目标; 判断强化学习选择的行为树是否能够独立完成任务,即,判断从初始状态开始,当前的行为树是否能够驱动智能体完成全部任务目标,若为是,说明当前的行为树已经达到算法目标,流程结束,若为否,返回步骤4; 步骤6:累加神经网络输出层的价值估计值; 将当前强化学习对每个行为树的价值估计进行累加; 步骤7:判断迭代次数是否超过阈值; 判断强化学习的迭代次数是否超过一个既定的阈值;若为是,进入步骤7,若为否,返回步骤3,进行新的一轮迭代; 步骤8:计算行为树适应度; 根据累积的行为树价值估计,计算行为树适应度; 步骤9:运行遗传算法,生成新的行为树; 根据行为树的适应度,保留父代中适应度最高的N个行为树,生成子代行为树,并替换其余行为树,保持行为树总数不变; 其中,生成子代行为树的过程包括重组和变异;所述重组,是对保留的父代行为树节点进行随机重组,生成新的子代行为树;所述变异,是从步骤1中的行为树库里取出节点子树,对子代行为树的节点子树进行随机替换; 步骤10:更新动作空间; 使用保留的父代行为树和生成的子代行为树更新动作空间,父代行为树的位置不变,子代行为树填补空缺位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军军事科学院战争研究院,其通讯地址为:100091 北京市海淀区厢红旗东门外1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励