汉江国家实验室龚俊斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉汉江国家实验室申请的专利基于深度强化学习的搜索路径规划方法、装置及评估方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120146358B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510627031.8,技术领域涉及:G06Q10/047;该发明授权基于深度强化学习的搜索路径规划方法、装置及评估方法是由龚俊斌;陈欢;汪晶晗;杨锦涛;张萌飞设计研发完成,并于2025-05-15向国家知识产权局提交的专利申请。
本基于深度强化学习的搜索路径规划方法、装置及评估方法在说明书摘要公布了:本申请涉及搜索路径规划技术领域,具体涉及一种基于深度强化学习的搜索路径规划方法、装置及评估方法。该搜索路径规划方法包括以下步骤:基于搜索环境参数,建立关于探测能力的环境矩阵,并设定起点;已训练好的神经网络基于智能体的当前位置、奖励函数和环境矩阵,输出各动作对应的Q值,所述奖励函数根据当前位置及其与目标点的距离、当前位置邻域的探测能力以及未访问区域数量设计;智能体根据Q值最大对应的动作执行每下一步动作。能够解决现有技术中存在强化学习算法在面对复杂任务时往往难以同时兼顾效率与稳定性,可能导致路径规划时间过长或结果偏离全局最优,影响实际应用效果的问题。
本发明授权基于深度强化学习的搜索路径规划方法、装置及评估方法在权利要求书中公布了:1.一种基于深度强化学习的搜索路径规划方法,其特征在于,包括以下步骤: 基于搜索环境参数,建立关于探测能力的环境矩阵,并设定起点; 已训练好的神经网络基于智能体的当前位置、奖励函数和环境矩阵,输出各动作对应的Q值,所述奖励函数根据当前位置及其与目标点的距离、当前位置邻域的探测能力以及未访问区域数量设计; 智能体根据Q值最大对应的动作执行每下一步动作; 所述奖励函数为: ; 其中,代表智能体的当前位置,为执行动作a后位于位置S处对应的多因素即时奖励,为当前位置探测能力奖励,为目标距离奖励,为邻域探测能力奖励,为未访问区域奖励,为目标距离奖励权重,为邻域探测能力奖励权重,为未访问区域奖励权重; 当前位置探测能力奖励,其中,为当前位置的探测能力值,i,j分别为环境矩阵行列编号; 目标距离奖励,其中,为智能体当前位置与目标点之间的欧几里得距离,为距离奖励的权重参数,为智能体当前位置,为目标点位置; 邻域探测能力奖励,其中,为当前位置的邻域范围,n为当前执行时间步序号,为时间步n时刻智能体位置的探测能力; 未访问区域奖励,其中,为调整奖励的超参数,为时间步t时刻根据奖励函数得到的多因素即时奖励,为位置是否为未访问区域的记录,t为时间步序号,为当前位置的探测能力值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人汉江国家实验室,其通讯地址为:430064 湖北省武汉市武昌区张之洞路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。