首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向稀疏奖励的深度强化学习机械臂抓取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国矿业大学

摘要:本发明公开了一种面向稀疏奖励的深度强化学习机械臂抓取方法,包括首先分析机械臂抓取任务特点,将其建模为马尔可夫决策问题,设计二元稀疏奖励,减少奖励函数设计的复杂度,降低设计成本;其次,以DDPG算法为主体深度强化学习训练算法框架,搭建Actor‑Critic结构网络,对连续状态动作空间进行处理;然后,设计事后经验回放机制,使用G‑HGG算法进行辅助目标生成,使用预训练动作网络进行动作筛选并加入探索噪声与能量函数对累积经验池进行处理,增强经验利用率,提高训练效率与抓取成功率;最后,搭建机械臂模型与场景信息,利用交互数据进行优化训练,实现机械臂目标抓取,本方法能够解决稀疏奖励下机械臂的抓取学习问题。

主权项:1.一种面向稀疏奖励的深度强化学习机械臂抓取方法,其特征在于,包括以下步骤:步骤1、分析机械臂抓取任务特点,将其建模为马尔可夫决策问题,设计二元稀疏奖励函数;步骤2、基于深度强化学习DDPG算法,搭建Actor-Critic结构的主网络和目标网络;步骤3、设计事后经验回放机制,使用G-HGG算法生成辅助目标,使用预训练动作网络进行动作筛选,加入探索噪声与能量函数,累积经验回放池;步骤4、搭建机械臂模型与场景信息,利用交互数据估计值函数并更新策略,得到确定性策略,完成目标抓取任务。

全文数据:

权利要求:

百度查询: 中国矿业大学 一种面向稀疏奖励的深度强化学习机械臂抓取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。