首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于深度强化学习的机械臂精准控制充电盖开合方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国网(山东)电动汽车服务有限公司

摘要:本发明属于机械臂控制技术领域,涉及一种基于深度强化学习的机械臂精准控制充电盖开合方法,包括机械臂精准控制充电盖开合模型的构建方法和模型训练方法。机械臂精准控制充电盖开合模型的构建方法考虑按照机械臂的固有形态分节构建多个神经网络,且构建机械臂各节的序列关系,避免了导致深度强化学习的动作空间过大,难以收敛,影响机械臂控制的时效性的问题;基于控制序列迭代优化的机械臂精准控制充电盖开合模型训练方法,考虑根据移动路径长度、障碍碰撞情况、各关节摩擦、位置误差等反馈情况计算损失函数,基于损失函数对各神经网络进行迭代更新,从而为机械臂各节提供精准的移动轨迹控制策略。

主权项:1.基于深度强化学习的机械臂精准控制充电盖开合方法,其特征在于,包括机械臂精准控制充电盖开合模型的构建和机械臂精准控制充电盖开合模型的训练;所述的机械臂精准控制充电盖开合模型的构建步骤为:基于多网络衔接,(A1)按照机械臂的固有形态,为每节机械臂分别构建一个神经网络;(A2)构建机械臂的控制序列关系,进而得到各神经网络的序列关系;(A3)将最终目的位置、前序机械臂位置、所有故障位置输入各神经网络,各神经网络输出对应节机械臂的移动轨迹控制策略,并将前序神经网络输出的移动轨迹控制策略输入到后序神经网络中,得到机械臂精准控制充电盖开合模型;所述的机械臂精准控制充电盖开合模型的训练步骤为:基于控制序列迭代优化,(B1)构建机械臂精准控制充电盖开合模型总体损失函数并判断是否低于预设阀值;若是,模型输出最优的机械臂移动轨迹移动策略;若否,执行B2-B3;(B2)将机械臂精准控制充电盖开合模型总体损失函数平分,获得机械臂的均分损失函数,基于最后一节机械臂的均分损失函数,采用梯度下降法更新其神经网络参数;(B3)基于后续机械臂反推更新前序机械臂的最优移动轨迹移动策略,计算反推更新的移动轨迹移动策略与原移动轨迹移动策略的偏差;基于偏差以及机械臂均分损失函数调整机械臂轨迹控制损失函数,基于机械臂轨迹控制损失函数更新各神经网络参数。

全文数据:

权利要求:

百度查询: 国网(山东)电动汽车服务有限公司 基于深度强化学习的机械臂精准控制充电盖开合方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。