一种基于模型融合的机械臂执行任务的控制方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：上海交通大学;中船智海创新研究院有限公司

摘要：本发明涉及一种基于模型融合的机械臂执行任务的控制方法，属于机器人控制技术领域，解决了现有机械臂执行多任务时完成效果不好的问题。包括：将融合模型部署至机械臂的控制系统中，融合模型是根据权重对多个训练好的强化学习模型的参数进行加权而得到；初始化机械臂的工作环境，基于任务采集物体和目标的信息，获取状态空间；将状态空间传入融合模型，融合模型的策略网络输出动作空间，根据动作空间控制机械臂执行相应动作后，更新状态空间，再将更新后的状态空间传入融合模型，直至根据输出的动作空间控制机械臂完成任务。实现了计算量小且准确度高的任务控制。

主权项：1.一种基于模型融合的机械臂执行任务的控制方法，其特征在于，包括以下步骤：将融合模型部署至机械臂的控制系统中，所述融合模型是根据权重对多个训练好的强化学习模型的参数进行加权而得到；初始化机械臂的工作环境，基于任务采集物体和目标的信息，获取状态空间；将所述状态空间传入融合模型，所述融合模型的策略网络输出动作空间，根据动作空间控制机械臂执行相应动作后，更新状态空间，再将更新后的状态空间传入融合模型，直至根据输出的动作空间控制机械臂完成任务；所述强化学习模型包括策略网络和价值网络，基于仿真环境采用策略梯度算法通过以下两种方式训练得到：一种是面向相同的任务，通过不设置随机种子，在目标与物体属性、动作空间、状态空间、奖励函数完全相同的情况下训练得到；第二种是面向不同的任务，通过不设置随机种子，在动作空间、状态空间、奖励函数相同但目标与物体属性不同的情况下训练得到；所述权重通过以下步骤得到：基于每个强化学习模型，将机械臂与仿真环境交互多次产生的各条数据构建为样本集；利用样本集训练输出为奖励值的神经网络，得到奖励函数网络；在奖励函数网络的输入层前增加权重层形成权重网络，基于每个强化学习模型，利用以相同的状态空间与仿真环境交互一次产生的数据训练权重网络，得到权重层对应的每个强化学习模型的权重；所述将机械臂与仿真环境交互多次产生的各条数据构建为样本集，包括：将每条数据中的当前时刻的状态空间，以及，动作空间各维度的均值和方差作为一条样本，将每条数据中的仿真环境反馈的奖励值作为对应样本的样本标签，放入样本集中；所述仿真环境反馈的奖励值，是当前时刻物体与目标之间的距离的负数；所述状态空间包括：当前时刻的观测值、上一时刻的观测值和当前时刻的目标位置，其中所述观测值包括：末端执行器位置、末端执行器归一化后的开闭程度、物体位置和物体移动速度；所述动作空间包括：末端执行器位置和末端执行器归一化后的开闭程度。

全文数据：

权利要求：

百度查询：上海交通大学中船智海创新研究院有限公司一种基于模型融合的机械臂执行任务的控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种紧固件退火箱

下一篇：一种卫浴水路连接结构

相关技术

一种紧固件退火箱

一种卫浴水路连接结构

一种用于夜间钻探降噪及文明施工的围护设备

一种向心高效选粉机

一种具有多向角度可调的直播设备

一种电池内阻测试仪用自动分拣装置

一种幕墙平推窗施工用辅助工装

一种渔业环境监测装置

一种管壳式换热器进液口的密封装置

一种一体式工字轮

一种海上石油勘探专用焊接机

一种标准混合气的自动化配制装置

臂相关技术

LNG辅助加注臂_江苏长隆石化装备有限公司_202111199089.5

托臂连接件_海盐海马五金有限公司_202323599209.8

副臂节、伸缩副臂模组及起重机_中联重科股份有限公司_202420801018.0

车用悬架导向臂、导向臂连接结构及空气悬架系统_一汽解放汽车有限公司_202411432468.8

柔性机械臂的控制方法、装置及柔性机械臂_煤炭科学技术研究院有限公司_202410459064.1

一种可拆卸控制臂_玉环锐利机械有限公司_202420876646.5

一种三臂开箱机械_深圳华诚包装科技股份有限公司_202411372902.8

一种超薄移液臂_默齐辰_202323335517.X

一种双层喷臂结构_广东洁诺生活电器有限公司_202323419065.3

适配于挖掘臂的振动头_佛山市云雀振动器有限公司_202323505124.9

执行相关技术

末端执行器、末端执行器套组及控制系统_松下知识产权经营株式会社_202080070071.2

业务执行方法、装置、设备及介质_行吟信息科技(武汉)有限公司_202311725003.7

用于安全执行指令的方法_泰雷兹数字安全法国简易股份公司_202380033299.8

一种集成式执行控制器_中国重汽集团济南动力有限公司_202411109395.9

执行器、变速箱以及车辆_福缔汽车(太仓)有限公司_202310572649.X

一种智能风量执行器_珠海昊星自动化系统有限公司_202420184032.0

执行内容通道产生的装置及方法_瑞昱半导体股份有限公司_202010416643.X

一种高噪音需求的执行器_科博达重庆汽车电子有限公司_202411085564.X

一种静电吸附末端执行器_东莞市博钺电子有限公司_202411100003.2

一种电液执行机构_浙江天泰控制设备有限公司_202420213767.1

机械相关技术

新能源作业机械_中联重科股份有限公司_202411062061.0

电动式建筑机械_株式会社小松制作所_202380031629.X

驱动装置和作业机械_纳博特斯克有限公司_201910700882.5

化学机械抛光剂及化学机械抛光工艺_上海积塔半导体有限公司_202411047413.5

柔性机械臂的控制方法、装置及柔性机械臂_煤炭科学技术研究院有限公司_202410459064.1

一种三臂开箱机械_深圳华诚包装科技股份有限公司_202411372902.8

一种机械薄壁夹具_常州凯瑞莱精密工具有限公司_202323660158.5

一种钢瓶阀门机械夹具_辽宁中润寰宇安检技术咨询有限公司_202422477357.0

机械联锁装置及开关设备_特变电工云集电气有限公司_202411090045.2

回转支承机构和工程机械_湖南中联重科履带起重机有限公司_202420454324.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于模型融合的机械臂执行任务的控制方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务