安徽大学;埃夫特智能机器人股份有限公司王承获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽大学;埃夫特智能机器人股份有限公司申请的专利一种基于强化学习的蛇形机器人控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120046650B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510119653.X,技术领域涉及:G06N3/008;该发明授权一种基于强化学习的蛇形机器人控制方法是由王承;周云虎;黄大荣;那雨虹;杜库设计研发完成,并于2025-01-24向国家知识产权局提交的专利申请。
本一种基于强化学习的蛇形机器人控制方法在说明书摘要公布了:本发明公开了一种基于强化学习的蛇形机器人控制方法,包括:搭建包含墙壁、立方体障碍物和低矮通道的复杂地形仿真场景;对蛇形机器人的结构、关节及动力学参数进行建模,得到蛇形机器人仿真模型;定义蛇形机器人的状态空间和动作空间,并设计多元化的奖励函数;采用多层感知器MLP结构构建动作网络和价值网络;应用强化学习算法对蛇形机器人进行多轮仿真训练,使机器人学到不同情景下做出优化决策的参数集,实现蛇形机器人的优化控制,到达目标点。本发明无需依赖视觉信息,能够通过自主学习实现蛇形机器人在复杂环境中高效、稳定运动控制,提升在低矮狭窄空间的穿越能力。
本发明授权一种基于强化学习的蛇形机器人控制方法在权利要求书中公布了:1.一种基于强化学习的蛇形机器人控制方法,其特征在于,包括以下步骤: 步骤一:搭建包含墙壁、立方体障碍物和低矮通道的复杂地形仿真场景; 所述仿真场景,在环境两侧设置墙壁,防止蛇形机器人超出预定区域,并引导其通过低矮通道;在环境中放置多个立方体障碍物,形成狭窄的通道,确保蛇形机器人需要通过低矮通道才能继续前进,同时到达目标点的最短路径所需经过的通道最窄,从而增加蛇形机器人通过低矮通道的挑战性; 步骤二:对蛇形机器人的结构、关节及动力学参数进行建模,得到蛇形机器人仿真模型; 步骤三:定义蛇形机器人的状态空间和动作空间,并综合考虑蛇形机器人的蛇头朝目标方向的移动速度、运动方向与目标方向的对齐程度、到目标点距离的变化、到目标点的距离、是否发生碰撞以及关节动作的幅度和变化设计多元化的奖励函数; 所述多元化的奖励函数为:Rt=Rforward+Rangle+Rdistance+Rtarget+Rcollision+Rcost,其中,前进奖励Rforward基于蛇头朝目标方向的移动速度给予奖励;角度奖励Rangle基于奖励蛇头的运动方向与目标方向的对齐程度给予奖励;距离变化奖励Rdistance基于蛇头到目标点距离的变化给予奖励或惩罚;目标距离惩罚Rtarget基于蛇头到目标点的距离给予惩罚;目标达成奖励Rcollision通过判断蛇头成功到达目标点给予惩罚;控制成本惩罚Rcost基于关节动作的幅度和变化给予惩罚; 所述Rforward的计算公式为:Rforward=wforward·vgoal,其中vgoal、wforward分别为蛇头速度在目标方向上的分量、权重系数; Rangle的计算公式为:Rangle=cosθ,其中,θ为蛇头的运动方向与目标方向的夹角; Rdistance的计算公式为:其中,Δd表示蛇头到与目标距离的变化量; Rtarget的计算公式为:其中,d表示当前蛇头到目标点的距离,dthreshold为距离阈值,w1为权重系数; Rcollision的计算公式为:其中,Ccollision是一个常数; Rcost表示机器人执行动作所消耗的资源,计算公式为:Rcost=w2·∑i|actioni|2,其中,w2是控制成本的权重系数,actioni是第i个动作的大小; 步骤四:采用多层感知器MLP结构构建动作网络和价值网络; 步骤五:基于步骤一至步骤四,应用强化学习算法对蛇形机器人进行多轮仿真训练,使机器人学到不同情景下做出优化决策的参数集,实现蛇形机器人的优化控制,到达目标点。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学;埃夫特智能机器人股份有限公司,其通讯地址为:230601 安徽省合肥市经济技术开发区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励