基于启发式深度强化学习的自主抓取与装箱方法及系统

导航：龙图腾网> 最新专利技术> 基于启发式深度强化学习的自主抓取与装箱方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山东大学

摘要：本发明公开了基于启发式深度强化学习的自主抓取与装箱方法及系统，其技术方案为：包括：获取抓取区域的深度图像信息，根据深度图像信息得到待装箱物体位置信息；获取放置区域的深度图像信息和待装箱物体尺寸信息，结合待装箱物体位置信息，并通过启发式深度强化学习的预测网络得到放置策略。本发明通过启发式深度强化学习方法，能够实现变尺寸物体的装箱任务，提高了装箱的空间利用率，且能够适用于真实环境。

主权项：1.基于启发式深度强化学习的自主抓取与装箱方法，其特征在于，包括：获取抓取区域的深度图像信息，根据深度图像信息得到待装箱物体位置信息；获取放置区域的深度图像信息和待装箱物体尺寸信息，结合待装箱物体位置信息，并通过启发式深度强化学习的预测网络得到放置策略；为使物体紧凑的放置在放置箱靠近边缘的角落，将边界信息建模到待放置物体的状态表征中，具体为：对于尺寸为l×w×h的物体，设置三个角落放置动作索引c1,c2,c3，如下: 通过这三个动作索引将待装箱物体的尺寸元组l,w,h扩充成六维向量元组v＝l,w,h,c1,c2,c3，其中用来表示物体；最终箱子和物体的表征被编码并融合，作为深度强化学习框架的输入；将装箱经验编码到一个经验模块中，通过结合四种启发式算法设计经验模块：通过结合首次适应算法、层式摆放算法、柱式摆放算法、极端点算法四种启发式方法，生成一个指示优先放置位置的掩码E，E是一个L×W二进制矩阵，其非零项的集合被表示为为了将启发式方法结合到深度强化学习中，通过负奖励H来惩罚离中的项ei,ej太远的位置；同时，当强化学习预测的位置足够接近ei,ej，它将只从环境交互中更新，而不会受到启发式经验的影响；在仿真环境中训练好放置预测网络，即启发式深度强化学习；将获取的抓取区域、放置区域的真实图像进行裁剪，采用核函数对深度图像进行滤波；将图像重新投影到正交高度图上；利用双线性插值将真实环境的高分辨率高度图映射到仿真环境的观测空间中，并用训练好的模型进行位置预测。

全文数据：

权利要求：

百度查询：山东大学基于启发式深度强化学习的自主抓取与装箱方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种高质量铝型材热挤压冷却成型装置及其方法

下一篇：一种应用于游泳场馆的恒温除湿热泵系统

相关技术

一种高质量铝型材热挤压冷却成型装置及其方法

一种应用于游泳场馆的恒温除湿热泵系统

一种超疏水分离膜的制备方法

生产硬化钢部件的方法

一种穿线组件及局部放电检测装置

神经调节导管

一种林业遥感无人机及其方法

一种自动化振动清洗设备

一种防逆流烟道

一种林业剪枝器

一种安全通信方法、系统、设备和介质

一种提高采收率用纳米渗吸驱油剂

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于启发式深度强化学习的自主抓取与装箱方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务