首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于启发式深度强化学习的自主抓取与装箱方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东大学

摘要:本发明公开了基于启发式深度强化学习的自主抓取与装箱方法及系统,其技术方案为:包括:获取抓取区域的深度图像信息,根据深度图像信息得到待装箱物体位置信息;获取放置区域的深度图像信息和待装箱物体尺寸信息,结合待装箱物体位置信息,并通过启发式深度强化学习的预测网络得到放置策略。本发明通过启发式深度强化学习方法,能够实现变尺寸物体的装箱任务,提高了装箱的空间利用率,且能够适用于真实环境。

主权项:1.基于启发式深度强化学习的自主抓取与装箱方法,其特征在于,包括:获取抓取区域的深度图像信息,根据深度图像信息得到待装箱物体位置信息;获取放置区域的深度图像信息和待装箱物体尺寸信息,结合待装箱物体位置信息,并通过启发式深度强化学习的预测网络得到放置策略;为使物体紧凑的放置在放置箱靠近边缘的角落,将边界信息建模到待放置物体的状态表征中,具体为:对于尺寸为l×w×h的物体,设置三个角落放置动作索引c1,c2,c3,如下: 通过这三个动作索引将待装箱物体的尺寸元组l,w,h扩充成六维向量元组v=l,w,h,c1,c2,c3,其中用来表示物体;最终箱子和物体的表征被编码并融合,作为深度强化学习框架的输入;将装箱经验编码到一个经验模块中,通过结合四种启发式算法设计经验模块:通过结合首次适应算法、层式摆放算法、柱式摆放算法、极端点算法四种启发式方法,生成一个指示优先放置位置的掩码E,E是一个L×W二进制矩阵,其非零项的集合被表示为为了将启发式方法结合到深度强化学习中,通过负奖励H来惩罚离中的项ei,ej太远的位置;同时,当强化学习预测的位置足够接近ei,ej,它将只从环境交互中更新,而不会受到启发式经验的影响;在仿真环境中训练好放置预测网络,即启发式深度强化学习;将获取的抓取区域、放置区域的真实图像进行裁剪,采用核函数对深度图像进行滤波;将图像重新投影到正交高度图上;利用双线性插值将真实环境的高分辨率高度图映射到仿真环境的观测空间中,并用训练好的模型进行位置预测。

全文数据:

权利要求:

百度查询: 山东大学 基于启发式深度强化学习的自主抓取与装箱方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。