Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京理工大学孙健获国家专利权

北京理工大学孙健获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京理工大学申请的专利基于分层深度强化学习的多机器人安全导航方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116339331B

龙图腾网通过国家知识产权局官网在2026-01-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310289886.5,技术领域涉及:G05D1/43;该发明授权基于分层深度强化学习的多机器人安全导航方法及系统是由孙健;晏玮;王钢;陈杰设计研发完成,并于2023-03-23向国家知识产权局提交的专利申请。

基于分层深度强化学习的多机器人安全导航方法及系统在说明书摘要公布了:本发明公开了基于分层深度强化学习的多机器人安全导航方法及系统,属于深度强化学习技术领域,尤其涉及基于深度强化学习的多机器人导航方法。该方法采用基于技能的分层深度强化学习模型框架,通过设计基于规则的目标驱动策略和安全转向策略,以及基于深度强化学习的避障导航策略,分别实现目标接近、紧急制动以及避障导航三种低层行为策略;通过深度强化学习训练高层的行为选择策略,学习好的行为选择模型能够有效避免对人为设计策略选择规则的依赖。本发明通过设计多个基于传统控制规则的子行为策略,以及引入基于深度强化学习的行为选择策略,加强了机器人对当前环境的辨识能力,提高了多机器人避障导航的快速性以及安全性。

本发明授权基于分层深度强化学习的多机器人安全导航方法及系统在权利要求书中公布了:1.基于分层深度强化学习的多机器人安全导航方法,其特征在于,该方法的步骤包括: 步骤1:针对多机器人导航问题模型,构建分层深度强化学习网络框架;所述网络框架包括六个模块:输入模块、特征提取模块、行为选择模块、DRL控制模块、辅助控制模块以及输出模块; 所述输入模块用于接收获取每个机器人对环境的观测数据,包括三个部分,其一为机器人实时的激光雷达搜索帧,其二为机器人坐标系下的目标点坐标,其三为实时的机器人速度;其中激光雷达搜索帧送入特征提取模块,目标点坐标和机器人速度的组合送入行为选择模块;特征提取模块的输出、目标点坐标和机器人速度的组合送入DRL控制模块;目标点坐标送入辅助控制模块; 所述特征提取模块由一维卷积网络组成,用于针对激光雷达搜索帧进行环境特征提取,所提取到的环境特征送入行为选择模块和DRL控制模块; 所述行为选择模块由全连接层组成,根据环境特征、目标点坐标以及机器人速度,生成离散动作值并输出,离散动作值分别对应三种子行为策略,所述子行为策略包括DRL策略、目标驱动策略和安全转向策略; 所述DRL控制模块由全连接层组成,用于执行DRL策略,所述DRL策略是根据环境特征、目标点坐标和速度的组合来控制机器人进行避障,生成机器人避障控制指令; 所述辅助控制模块用于执行目标驱动策略和安全转向策略,所述目标驱动策略是根据目标点坐标驱动控制机器人向目标行进,生成目标驱动控制指令;所述安全转向策略用于控制机器人紧急制动并转向,生成转向控制指令; 所述输出模块用于根据行为选择模块的输出,确定取一子行为策略的控制指令并输出,用于对机器人进行控制; 步骤2:训练所述DRL控制模块; 步骤3:训练所述行为选择模块; 步骤4:针对经过步骤2和3训练好的分层深度强化学习网络框架,对多机器人系统进行导航控制。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。