集美大学吴德烽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉集美大学申请的专利一种基于记忆机制深度强化学习的无人船避碰方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120010498B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510484094.2,技术领域涉及:G05D1/43;该发明授权一种基于记忆机制深度强化学习的无人船避碰方法是由吴德烽;范镇鸿;黎国强;游政;武东杰;涂婉丽;陈国权;刘启俊;钟尚坤设计研发完成,并于2025-04-17向国家知识产权局提交的专利申请。
本一种基于记忆机制深度强化学习的无人船避碰方法在说明书摘要公布了:本发明提供一种基于记忆机制深度强化学习的无人船避碰方法,动态存储无人船的历史航行状态序列,构建固定长度的记忆空间,所述状态序列包括目标点相对位置、障碍物相对位置及历史动作数据;将所述记忆空间中的状态序列输入强化学习决策网络,通过门控循环单元提取时序特征,并结合多层感知机生成避碰动作指令;基于所述避碰动作指令控制无人船航行,并根据复合奖励函数计算即时奖励值优化网络参数,实现感知受限下的自主避碰。
本发明授权一种基于记忆机制深度强化学习的无人船避碰方法在权利要求书中公布了:1.一种基于记忆机制深度强化学习的无人船避碰方法,其特征在于: 动态存储无人船的历史航行状态序列,构建固定长度的记忆空间,所述状态序列包括目标点相对位置、障碍物相对位置及历史动作数据; 将所述记忆空间中的状态序列输入强化学习决策网络,通过门控循环单元提取时序特征,并结合多层感知机生成避碰动作指令; 基于所述避碰动作指令控制无人船航行,并根据复合奖励函数计算即时奖励值优化网络参数,实现感知受限下的自主避碰; 所述记忆空间通过先进先出队列实现,每次更新时移除最旧状态数据并新增当前状态数据; 所述门控循环单元的隐藏状态维度为128,MLP层维度为256,且决策网络输出推进力与转矩的高斯分布参数; 所述网络参数更新采用连续n步历史数据采样,并通过KL散度约束策略更新以避免记忆空间数据分布偏移导致的策略震荡。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人集美大学,其通讯地址为:361021 福建省厦门市集美区银江路185号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。