买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:天津大学
摘要:本发明涉及一种基于正向运动学的四足机器人视觉运动控制方法,分为盲策略阶段和视觉策略阶段;首先在仿真环境中训练盲策略,利用近端策略优化法PPO不断优化教师网络和基本策略网络,利用监督学习优化学生网络,然后将训练的盲策略部署在实际四足机器人上,并在不同地形下收集视觉数据,利用所收集数据训练视觉策略网络。
主权项:1.一种基于正向运动学的四足机器人视觉运动控制方法,分为盲策略阶段和视觉策略阶段;首先在仿真环境中训练盲策略,利用近端策略优化法PPO不断优化教师网络和基本策略网络,利用监督学习优化学生网络,然后将训练的盲策略部署在实际四足机器人上,并在不同地形下收集视觉数据,利用所收集数据训练视觉策略网络;该方法包括以下步骤:1设计四足机器人仿真环境,建立四足机器人仿真模型,将四足机器人模型导入仿真环境,在仿真环境中设计不同的地面坡度、摩擦系数、高度参数以实现不同难度的仿真地形;2设计四足机器人强化学习的奖励函数;3搭建盲策略阶段的神经网络,在阶段一中,训练一个可以访问特权信息的教师网络和基本策略网络,使用近端策略优化对教师网络和基本策略网络进行优化,得到盲策略阶段的教师网络和基本策略网络;在阶段二中,使用监督学习对学生网络进行优化;4在不同的仿真地形中重复步骤3,使四足机器人模型能通过各种仿真地形,由此得到训练好的盲策略学生网络;5使用盲策略收集数据,方法如下:将第二阶段训练好的盲策略学生网络部署到装有深度摄像头的实际四足机器人上,通过实际四足机器人读取本体感受器的信息,并将本体感受器的信息输入到部署的神经网络之中,得到目标的关节角度,使用机身自带的交换机将关节角度传输给实际四足机器人的比例微分控制器,从而计算得到关节扭矩,以此控制机器人在自然环境中运动;使用盲策略在现实环境中收集视觉信息和本体感受器的信息;选取多种地形,四足机器人在选取的地形上行走,收集有效数据;6根据收集的有效数据建立数据集,使用正向运动学的方法计算地形高度;方法如下:实际四足机器人在现实环境中收集数据后,得到包括I,prop,z,Q的数据对,其中I表示四足机器人相机输出,prop表示四足机器人本体感受器的信息,z表示盲策略学生网络输出的潜在环境向量,Q表示从四足机器人的惯性测量单元计算得来的四元数;接下来,定义三个机器人坐标系,{W}为世界坐标系,{B}为机身坐标系,原点固定在形心,x轴方向指向四足机器人头部,y轴方向朝向四足机器人左侧,z轴符合右手系定义,{O}为方向不变的机身坐标系,方向与世界坐标系相同;使用正向运动学的方法计算地形高度,得到四足机器人足端的地形高度γ;7使用收集的有效数据和地形高度训练视觉策略网络,方法如下:根据计算的地形高度,构建数据集I,prop,z,γ,视觉策略网络分为自适应模块和基本策略网络,其中基本策略网络使用盲策略阶段训练好的所述盲策略学生网络;自适应模块用于分析历史状态信息,处理本体感受器获取的数据和深度摄像头获取的图像数据,使用构建好的数据集中的z和γ作为参考,将历史时间步的状态信息和动作信息以及深度摄像头获取的图像数据作为输入,输出潜在环境向量和估计的地形高度,使用监督学习最小化估计值与目标值的损失值,使四足机器人根据本体感受器和来自深度摄像头的视觉信息估计未来的地形高度。
全文数据:
权利要求:
百度查询: 天津大学 一种基于正向运动学的四足机器人视觉运动控制方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。