昆明理工大学;昆明云内动力股份有限公司沈世全获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学;昆明云内动力股份有限公司申请的专利面向室内复杂环境的深度强化学习型路径规划方法及其装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120333460B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510746585.X,技术领域涉及:G01C21/20;该发明授权面向室内复杂环境的深度强化学习型路径规划方法及其装置是由沈世全;刘佳豪;王艳锋;张永齐;彭鹄;杨蝶飞设计研发完成,并于2025-06-05向国家知识产权局提交的专利申请。
本面向室内复杂环境的深度强化学习型路径规划方法及其装置在说明书摘要公布了:本发明公开了面向室内复杂环境的深度强化学习型路径规划方法及其装置,属于人工智能、深度学习和路径规划技术领域,包括:针对机器人在复杂动态环境中难以充分感知环境的问题,利用深度卷积神经网络提取特征信息,增强了对环境的感知能力;针对传统路径规划面对动态障碍物适应性差的状况,设计了一种基于近端策略优化算法的强化学习路径规划方法,并设计了一种基于速度障碍的启发式奖励函数,旨在指导机器人在保持目标方向的同时,找到一个既能动态避障又能快速向目标前进的路径,从而本发明能够使机器人在复杂场景中拥有高效的规划决策能力,以实现自主、安全、高效地导航至目标点。
本发明授权面向室内复杂环境的深度强化学习型路径规划方法及其装置在权利要求书中公布了:1.一种面向室内复杂环境的深度强化学习型路径规划方法,其特征在于:包括以下步骤: S1、通过雷达与摄像头传感器获取环境的感知数据,估计并识别追踪出机器人本体坐标系下的位姿状态、静态障碍物的空间分布以及周围行人的运动学参数,分模态处理生成:激光雷达信息数据图与行人位姿数据图; S2、利用深度卷积神经网络将激光雷达信息数据图与行人的位姿数据图进行多模态特征提取,生成包含环境结构特征、动态行人运动特征及可行区域约束的特征信息; S3、构建深度强化学习训练环境模型,基于近端策略优化PPO算法对深度强化学习训练环境模型进行网络初始化; S4、将提取到的特征信息作为强化学习部分观测状态的输入,采用多目标奖励函数基于深度强化学习近端策略优化算法训练最优控制策略; 所述步骤S4中近端策略优化PPO算法中的多目标奖励函数,是通过以下子步骤实现: S4.1、定义的多目标奖励函数由四个部分组成,分别是:到达目标奖励,避免碰撞奖励,防止机器人震荡奖励和基于速度加转向控制的主动避让奖励;即: rt=ra+rc+rx+rv_θ 其中,ra表示到达目标的奖励,rc表示避免碰撞奖励,ro表示防止机器人震荡奖励,rθ,v表示基于改进的速度障碍理论速度控制与横向转向控制主动避障奖励; S4.2、定义到达目标的奖励ra为: 其中,rarrival表示为到达目标点奖励系数;表示为在训练步骤t时,当前机器人的位置到目标点的距离;rwaypoint表示为路径点系数;gr表示为到达目标点的范围宽容;it表示为当前的训练步骤数;im表示为一次完整导航的最大步骤数; S4.3、定义避免碰撞奖励rc为: 其中,rcollision表示为碰撞惩罚系数;dmin是激光雷达扫描中非零值的最小距离,代表机器人与最近障碍物的距离,rrobot是机器人的半径,rs是扫描距离的惩罚系数; S4.4、定义防止震荡碰撞奖励ro为: ro=rsmooth×|θt-1-θt| 其中θt表示为机器人在步骤t时的方位角,rsmooth表示为震荡惩罚系数; S4.5、根据速度障碍理论定义一种基于速度加转向控制的主动避让奖励函数rθ,v; 其中ω1和ω2表示权重系数,表示为训练步骤t时机器人期望的最优航向角,θm表示为航向方向角的最大允许偏差系数,rθ表示为角度奖励系数,是机器人训练步骤t时的最优速度,Vm是最大偏差速,rv表示为速度奖励系数; S5、通过学习到的最优控制策略,获得机器人当前观测状态的最优动作,在不停车的状态下完成动态避障和导航任务,以实现在室内包含静态和多动态障碍物的复杂环境中的路径规划与自主导航。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学;昆明云内动力股份有限公司,其通讯地址为:650093 云南省昆明市一二一大街文昌路68号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。