中国电子科技集团有限公司电子科学研究院董琦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电子科技集团有限公司电子科学研究院申请的专利一种基于先验知识的四足机器人运动控制方法及其机器人获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120103862B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510229754.2,技术领域涉及:G05D1/49;该发明授权一种基于先验知识的四足机器人运动控制方法及其机器人是由董琦;胥嘉睿;吕友豪;庄圆;贾袁骏设计研发完成,并于2025-02-28向国家知识产权局提交的专利申请。
本一种基于先验知识的四足机器人运动控制方法及其机器人在说明书摘要公布了:本发明提供一种基于先验知识的四足机器人运动控制方法及其机器人,涉及机器人开发技术领域,包括以下步骤:S1:机器人与仿真环境构建;构建四足机器人仿真环境,包括四足机器人的物理模型、周围环境的物理属性以及四足机器人的深度相机、激光雷达、IMU等传感器。该方案最终实现解决现有运动控制方法中四足机器人鲁棒性弱和步态僵硬等问题,使四足机器人获得更自然的步态并提升其对崎岖地形的适应能力;本训练方法的成果对外部环境感知依赖较少,四足机器人即使没有地形信息,仍然能做出合理的运动决策,这种方法可以大幅减少训练和调试的时间,使得四足机器人能够直接从模拟环境快速部署到现实应用中。
本发明授权一种基于先验知识的四足机器人运动控制方法及其机器人在权利要求书中公布了:1.一种基于先验知识的四足机器人运动控制方法,其特征在于,包括以下步骤: S1:机器人与仿真环境构建; 构建四足机器人仿真环境,包括四足机器人的物理模型、周围环境的物理属性以及四足机器人的深度相机、激光雷达、IMU传感器; S2:骨架识别获取运动数据; 通过MicrosoftKinect深度相机捕捉四足机器人在平坦地形前进、后退、侧向移动、转向四种运动模式的深度图像,在深度图像上通过随机决策森林分类器来识别四足机器人的各个部分,从而进行每个像素的分类,根据分类结果,使用均值漂移算法估计四足机器人各个关节的位置,这种算法通过在局部密度最大的位置寻找全局质心来确定关节的3D位置,满足: ; 其中,是数据集中四足机器人四肢和躯干上各个点的坐标,是当前点的位置,为高斯核函数,作用是对每个数据点赋予一个权重,距离越近的点权重越高,其公式为,是带宽参数,决定了核函数的范围大小,算法将当前点沿着均值漂移向量的方向移动,直到收敛到当前肢体上的全局质心; 在每一帧中利用卡尔曼滤波对骨架模型进行优化,从而得到平滑的四足机器人结构,满足: ; 其中,为状态转移矩阵,为关节的状态向量,向量中是关节的初始位置,是初始速度; 用协方差矩阵预测状态的不确定性满足: ; 其中,是过程噪声协方差矩阵,用于描述系统模型的随机性或不确定性,初始化协方差矩阵; 卡尔曼增益决定了预测值与观测值之间的平衡关系,计算卡尔曼增益的公式为: ; 其中,是观测矩阵,用于从状态向量中提取关节位置,是测量噪声协方差矩阵,用来描述测量的可靠性; 根据观测值对预测状态进行校正,得到更新后的状态向量满足: ; 其中,是在时间步的测量值,是关节的观测位置,预测值与实际观测值的差异被用来修正预测的状态,从而减小了由于测量噪声导致的位置抖动,使得最终估计的轨迹更加平稳和自然; 通过以上步骤,就得到了一个运动数据集,包含四足机器人在平坦地形上前进、后退、侧向移动、转向的轨迹; S3:强化学习框架设计; 使用强化学习结合对抗性运动先验的方法来训练机器人行走策略,对抗性运动先验通过引入生成对抗网络,评估机器人生成的运动状态是否与预先定义的参考运动数据集中的运动相似; 在仿真环境中,采用框架和算法优化四足机器人运动控制器,学习鲁棒的控制器来缩小仿真模型和实际模型的差异,提高泛化能力,生成有效的运动控制策略; 在训练过程中,教师策略能够访问丰富的状态信息,包括本体感知信息、特权状态和地形信息,教师策略的目标是通过强化学习来优化控制策略,使四足机器人能在复杂地形上实现稳健行走,教师策略不仅依赖这些丰富的状态信息,还会得到任务奖励、风格奖励和正则化奖励满足: ; 其中,是任务奖励,包括速度跟踪或任务完成度,是基于对抗性运动先验的风格奖励,鼓励生成自然的步态,是正则化奖励,用于约束机器人的运动平滑性和安全性; 生成器的训练目标是使得机器人在执行动作时获得较高的风格奖励,即生成尽可能接近数据集中的自然动作,风格奖励满足: ; 其中,dscoret是判别器输出的相似度得分,得分越高,表明四足机器人当前的动作与真实数据中的步态越相似; 所述判别器的优化目标是将如下损失函数最小化: ; 其中,表示样本来自生成的运动数据集,表示样本来自生成器生成的产生的动作序列,是判别器输出的分数,即对状态转移的真实性判定,输出1表示真实运动,输出-1表示来自生成器,为梯度惩罚项,约束判别器在数据样本上的梯度,防止训练过程中生成对抗网络常见的模式崩溃。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团有限公司电子科学研究院,其通讯地址为:100041 北京市石景山区八大处高科技园区双园路11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。