首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于增量式模型的机械臂避障规划方法、装置及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国网天津市电力公司建设分公司;国网天津市电力公司;国家电网有限公司

摘要:本发明公开了一种基于增量式模型的机械臂避障规划方法、装置及存储介质。其中,方法包括如下:获取当前任务的障碍物信息e和目标构型θgoal输入到训练好的增量式学习模型,得到经验最优初始化参数Θcur;在当前轨迹附近Θcur使用高斯分布生成K条噪声轨迹Θcur+ε,其中ε为均值为零的高斯噪声,对每条噪声轨迹进行评估,并根据评估结果得到当前最优更新量δΘ;更新当前参数:θcur=θcur+δθi,评估是否收敛,如果收敛得到最优轨迹参数Θopt。本发明使用增量式学习模型来学习障碍物环境和目标构型到最优随机轨迹参数的映射,可以将轨迹初始化到次优解,从而提升了优化的效率。

主权项:1.一种基于增量式模型的机械臂避障规划方法,其特征在于,所述方法包括如下步骤:步骤一:获取当前任务的障碍物信息e和目标构型θgoal输入到训练好的增量式学习模型,得到经验最优初始化参数Θcur;步骤二:在当前轨迹附近Θcur使用高斯分布生成K条噪声轨迹Θcur+ε,其中ε为均值为零的高斯噪声,对每条噪声轨迹进行评估,并根据评估结果得到当前最优更新量δΘ,具体公式为: 其中qθk,i为每个时间步的回报,SΘk,t为T步的总回报,λ为回报因子;步骤三:更新当前参数:θtt,cur=θt,cur+δθi,其中θt,cur为第t个时间步的机械臂的构型,评估是否收敛,如果收敛得到最优轨迹参数Θopt,机械臂依据最优轨迹参数Θopt进行避障;所述增量式学习模型的具体公式为: 其中,z=[e,θgoal],e为障碍物信息,ck为第k个感受野的中心,wk为第k个基函数的权重,ψkz为第k个基函数,W为K个权重的和;利用训练数据集增量式地带入上述模型中进行训练,得到训练好的增量式学习模型;所述训练数据集通过下述步骤获取:第一步:在障碍物空间{xc,yc,zc,l,w,h}空间和目标构型空间Θgoal空间随机生成多个障碍物和目标点;第二步:在当前轨迹附近Θcur使用高斯分布生成K条噪声轨迹Θcur+∈,其中∈为高斯噪声,其均值为δΘ,对每条噪声轨迹进行评估,并根据评估结果得到当前最优更新量δΘ,具体公式为: 第三步:更新当前参数:θt,cur=θt,cur+δθi,其中θt,cur为第t个时间步的机械臂的构型,评估是否收敛,如果收敛得到最优轨迹参数Θopt,否则返回第二步;第四步:将障碍物信息e、目标构型θgoal和最优轨迹参数Θopt作为一条数据存储到数据集D中。

全文数据:

权利要求:

百度查询: 国网天津市电力公司建设分公司 国网天津市电力公司 国家电网有限公司 基于增量式模型的机械臂避障规划方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。