基于增量式模型的机械臂避障规划方法、装置及存储介质

导航：龙图腾网> 最新专利技术> 基于增量式模型的机械臂避障规划方法、装置及存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：国网天津市电力公司建设分公司;国网天津市电力公司;国家电网有限公司

摘要：本发明公开了一种基于增量式模型的机械臂避障规划方法、装置及存储介质。其中，方法包括如下：获取当前任务的障碍物信息e和目标构型θgoal输入到训练好的增量式学习模型，得到经验最优初始化参数Θcur；在当前轨迹附近Θcur使用高斯分布生成K条噪声轨迹Θcur+ε,其中ε为均值为零的高斯噪声，对每条噪声轨迹进行评估，并根据评估结果得到当前最优更新量δΘ；更新当前参数：θcur＝θcur+δθi，评估是否收敛，如果收敛得到最优轨迹参数Θopt。本发明使用增量式学习模型来学习障碍物环境和目标构型到最优随机轨迹参数的映射，可以将轨迹初始化到次优解，从而提升了优化的效率。

主权项：1.一种基于增量式模型的机械臂避障规划方法，其特征在于，所述方法包括如下步骤：步骤一：获取当前任务的障碍物信息e和目标构型θgoal输入到训练好的增量式学习模型，得到经验最优初始化参数Θcur；步骤二：在当前轨迹附近Θcur使用高斯分布生成K条噪声轨迹Θcur+ε,其中ε为均值为零的高斯噪声，对每条噪声轨迹进行评估，并根据评估结果得到当前最优更新量δΘ，具体公式为：其中qθk,i为每个时间步的回报，SΘk,t为T步的总回报，λ为回报因子；步骤三：更新当前参数：θtt,cur＝θt,cur+δθi，其中θt,cur为第t个时间步的机械臂的构型，评估是否收敛，如果收敛得到最优轨迹参数Θopt，机械臂依据最优轨迹参数Θopt进行避障；所述增量式学习模型的具体公式为：其中，z＝[e,θgoal]，e为障碍物信息，ck为第k个感受野的中心，wk为第k个基函数的权重，ψkz为第k个基函数，W为K个权重的和；利用训练数据集增量式地带入上述模型中进行训练，得到训练好的增量式学习模型；所述训练数据集通过下述步骤获取：第一步：在障碍物空间{xc,yc,zc，l,w,h}空间和目标构型空间Θgoal空间随机生成多个障碍物和目标点；第二步：在当前轨迹附近Θcur使用高斯分布生成K条噪声轨迹Θcur+∈，其中∈为高斯噪声，其均值为δΘ，对每条噪声轨迹进行评估，并根据评估结果得到当前最优更新量δΘ，具体公式为：第三步：更新当前参数：θt,cur＝θt,cur+δθi，其中θt,cur为第t个时间步的机械臂的构型，评估是否收敛，如果收敛得到最优轨迹参数Θopt，否则返回第二步；第四步：将障碍物信息e、目标构型θgoal和最优轨迹参数Θopt作为一条数据存储到数据集D中。

全文数据：

权利要求：

百度查询：国网天津市电力公司建设分公司国网天津市电力公司国家电网有限公司基于增量式模型的机械臂避障规划方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种网络地址处理方法、装置、电子设备、介质

下一篇：用于声音事件定位和检测的方法和系统

相关技术

一种网络地址处理方法、装置、电子设备、介质

用于声音事件定位和检测的方法和系统

一种铁基层状氧化物钠离子电池正极材料及其制备方法和应用

一种含有人参提取物的美白保湿抗衰老多效面霜及其制备方法

数据传输方法、装置、电子设备及存储介质

一种快速一步法合成噻二唑-三嗪化合物的方法和应用

业务管制方法、系统、电子设备及存储介质

一种数据流通方法及其系统、装置、通信节点

SERPIN肽及其使用方法

计费规则更新方法、装置、设备与存储介质

一种管道内爬行机器人及其使用方法

具有辅助层的半导体元件及其制备方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于增量式模型的机械臂避障规划方法、装置及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务