南京航空航天大学黄圣君获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京航空航天大学申请的专利一种基于条件扩散模型挑选技能的机器人双层控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119328763B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411700692.0,技术领域涉及:B25J9/16;该发明授权一种基于条件扩散模型挑选技能的机器人双层控制方法是由黄圣君;王烨文;宗辰辰设计研发完成,并于2024-11-26向国家知识产权局提交的专利申请。
本一种基于条件扩散模型挑选技能的机器人双层控制方法在说明书摘要公布了:本发明公开了一种基于条件扩散模型挑选技能的机器人双层控制方法,将原先时间跨度漫长的强化学习轨迹通过双层策略构筑,将其抽象成为上层策略选择技能执行的较短时间跨度的任务;在策略预训练阶段,引入额外条件将机器人位姿状态以及选取技能进行了平衡的绑定,从而提高了机器人在强化学习环境中的探索速率,使得机器人智能体能够在更短时间内组合不同的技能以完成任务;在策略微调阶段引入强化学习PPO算法以最大化累计奖赏为目标,不断微调上层技能选取策略的技能选取策略,直至模型收敛。本发明能够在长时间跨度的机器人任务上将原先的动作空间下采样的较小的技能空间,并绑定不同位姿状态和其技能的相关性,从而减少技能探索空间以加速探索。
本发明授权一种基于条件扩散模型挑选技能的机器人双层控制方法在权利要求书中公布了:1.一种基于条件扩散模型挑选技能的机器人双层控制方法,其特征在于,包括策略预训练阶段和策略微调阶段; 所述策略预训练阶段为: 给定一组带有N条机器人位姿轨迹S和动作序列A的训练数据集,初始化机器人底层控制策略与上层控制策略模型组件; 从数据集中随机挑选B个样本,并在位姿轨迹中随机切片出长度为T的位姿轨迹BT; 利用LSTM网络作为编码器对位姿轨迹切片BT中的S和A进行编码得到技能z,并利用基于LSTM的解码器作为双层控制中的底层控制策略πlo,根据z以及Bl中的位姿状态S还原出对应的动作序列A,计算动作模仿损失函数 初始化基于扩散模型的机器人上层技能选取策略πhi,将BT中的位姿状态S以及技能z通过扩散模型进行绑定,并将动作序列A进行归一化作为条件扩散模型的额外条件c,实现上层技能选取策略πhi通过不同的额外条件c采样到不同的技能向量z,扩散模型的训练过程由损失函数实现; 确定用于训练底层控制策略与上层技能选取策略的总损失函数; 所述策略微调阶段为: 初始化条件选择模型组件,机器人采用条件选择模型πc生成额外条件c,并由上层技能选取策略πhi采样额外条件c所对应的技能z并交由底层控制策略πlo还原动作,利用PPO算法损失和状态价值评估网络损失为不同的位姿状态找到最优的技能以运行机器人,并不断微调上层技能选取策略的技能选取策略,迭代优化模型,直至机器人底层控制策略与上层技能选取策略模型收敛。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:211106 江苏省南京市江宁区将军大道29号南京航空航天大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励