买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京人形机器人创新中心有限公司
摘要:本发明公开了一种机器人运动控制模型训练方法和机器人运动控制方法,应用于智能控制技术领域,包括:基于当前时刻的训练机器人状态,利用待训练运动控制模型,得到未来预设帧数的训练控制指令和训练隐变量;基于训练隐变量,利用待训练运动控制模型进行预测,得到未来预设时刻的机器人预测状态;利用仿真引擎依次执行预设帧数的训练控制指令,得到机器人实际状态;根据预设时刻的机器人预测状态和机器人实际状态,更新待训练运动控制模型的参数,得到训练好的运动控制模型。本申请训练时根据机器人预测状态和机器人实际状态更新模型参数,使得该模型对未来机器人状态的预测更接近实际机器人状态,从而提高后续对机器人控制的稳定性。
主权项:1.一种机器人运动控制模型训练方法,其特征在于,包括:基于当前时刻的训练机器人状态,利用待训练运动控制模型,得到未来预设帧数的训练控制指令和训练隐变量;其中,所述预设帧数大于1,所述训练隐变量为不可观测的随机变量;基于所述训练隐变量,利用所述待训练运动控制模型进行预测,得到未来预设时刻的机器人预测状态;其中,所述预设时刻根据所述待训练运动控制模型的参数更新周期确定;利用仿真引擎依次执行所述预设帧数的训练控制指令,得到机器人实际状态和环境状态;根据所述预设时刻的机器人预测状态和所述机器人实际状态,以及所述环境状态更新所述待训练运动控制模型的参数,得到训练好的运动控制模型;其中,根据所述预设时刻的机器人预测状态和所述机器人实际状态,以及所述环境状态更新所述待训练运动控制模型的参数,得到训练好的运动控制模型,包括:根据所述预设时刻的机器人预测状态,及其对应的预设时刻的机器人实际状态,确定状态预测奖励;状态预测奖励的公式为,其中,j为状态预测奖励,为预设时刻的机器人实际状态,为预设时刻的机器人预测状态;根据所述仿真引擎得到的所述机器人实际状态和所述环境状态,确定任务奖励;根据所述状态预测奖励和所述任务奖励,更新所述待训练运动控制模型的参数。
全文数据:
权利要求:
百度查询: 北京人形机器人创新中心有限公司 一种机器人运动控制模型训练方法和机器人运动控制方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。