浙江大学朱秋国获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于混合表征学习的四足机器人三维环境全向运动控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119620757B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411747494.X,技术领域涉及:G05D1/43;该发明授权一种基于混合表征学习的四足机器人三维环境全向运动控制方法是由朱秋国;李松波;吴俊设计研发完成,并于2024-12-02向国家知识产权局提交的专利申请。
本一种基于混合表征学习的四足机器人三维环境全向运动控制方法在说明书摘要公布了:针对现有四足机器人运动控制方法受限于机器人狭窄的前向视角以及外部感知噪声,进而难以获得在三维环境中的全向运动能力,本发明提出了一种基于混合表征学习的四足机器人三维环境全向运动控制方法,包括:设计一阶段端到端神经网络学习框架各项输入输出内容,基于强化学习框架设计包含混合表征学习的训练流程,构建各模块具体神经网络模型,搭建四足机器人仿真运动控制训练环境。该方法的优点在于提供了利于高效学习机器人实际观测与环境真值间关系的网络输入输出内容,引入包含监督学习和对比学习的混合表征学习方法,使在训练过程中机器人可以有效推断超出其视野范围的环境信息。
本发明授权一种基于混合表征学习的四足机器人三维环境全向运动控制方法在权利要求书中公布了:1.一种基于混合表征学习的四足机器人三维环境全向运动控制方法,其特征在于,包括以下步骤: S1、设计非对称动作网络-策略网络结构强化学习总体框架,并设计强化学习总体框架中神经网络各部分输入输出内容;所述神经网络包括标准输入特征提取编码器、特权信息输入特征提取编码器、动作网络和价值网络; S2、基于所述步骤S1中的强化学习总体框架,设计混合表征学习训练流程;所述混合表征学习包含监督学习、对比学习和强化学习方法; S21、设计基于监督学习方法的状态估计学习:在动作网络前构建一个编码器-解码器结构,其中编码器接受标准输入并提取特征,将输入降维至一个隐藏层向量;随后由解码器将该隐藏层向量解码为符合运动控制任务需求的各个状态估计值,与仿真中获取的状态真值间计算均方误差,进而实现梯度传播,指导标准输入编码器网络的更新; S22、设计基于对比学习方法的地形理解学习:在动作网络前构建一个编码器接受特权信息输入并提取特征,将输入降维至一个隐藏层向量;随后基于对比学习方法,计算该隐藏层向量与标准输入特征提取编码器输出中对比向量间对比误差,进而实现梯度传播,指导标准输入特征提取编码器网络与特权信息输入特征提取编码器网络的更新; S23、设计基于强化学习方法的运动控制学习:通过近端策略优化强化学习算法,计算值函数损失、替代策略损失与熵损失,其和构成PPO损失,进而实现梯度传播,指导动作网络与价值网络的更新; S3、基于所述步骤S2中的训练流程,为标准输入特征提取编码器、特权信息输入特征提取编码器、动作网络和价值网络搭建神经网络模型,实现训练所需的推理和梯度更新功能; S4、搭建仿真训练环境,设计适用于四足机器人学习在不同条件下通过三维环境全向运动技能的训练地形与奖励函数; S5、基于所述步骤S1的强化学习总体框架、步骤S2的训练流程、步骤S3的神经网络模型以及步骤S4的仿真训练环境,进行强化学习训练,获得适用于视觉感知有限情况的三维环境全向运动控制策略,并将该策略迁移部署在四足机器人上。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。