Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东莞理工学院王福杰获国家专利权

东莞理工学院王福杰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东莞理工学院申请的专利一种基于行为克隆的机械臂连续轨迹跟踪控制系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119748435B

龙图腾网通过国家知识产权局官网在2026-01-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411818777.9,技术领域涉及:B25J9/16;该发明授权一种基于行为克隆的机械臂连续轨迹跟踪控制系统是由王福杰;彭永岗;易佳豪;谢仲业;秦毅;郭芳;丁文霞设计研发完成,并于2024-12-11向国家知识产权局提交的专利申请。

一种基于行为克隆的机械臂连续轨迹跟踪控制系统在说明书摘要公布了:本发明涉及机械臂控制技术领域,尤其涉及一种基于行为克隆的机械臂连续轨迹跟踪控制系统,包括机械臂特征表达模块、比例智能体模块、行为克隆模块、多智能体模块、PID控制模块、奖励确定模块和更新模块,结合行为克隆采用多智能体深度强化学习的方法控制机械臂,PID智能体和DDR智能体两个智能体共同输出扭矩控制同一个机械臂,并采用两个奖励函数来优化两个智能体的策略网络,PID智能体用于输出PID控制器的参数再由PID控制器输出力矩控制机械臂,使机械臂能够跟踪不同于训练轨迹的其他轨迹,DDR智能体则直接输出扭矩增加控制器的抗干扰性,面对具有强随机干扰以及多变的环境下,具备抗干扰能力,提高了机械臂的运行精准度。

本发明授权一种基于行为克隆的机械臂连续轨迹跟踪控制系统在权利要求书中公布了:1.一种基于行为克隆的机械臂连续轨迹跟踪控制系统,其特征在于,包括: 机械臂特征表达模块,其用以通过动态方程对机械臂建模; 比例智能体模块,其用以通过非在线actor-criticDRL算法确定输出目标动作; 行为克隆模块,其用以基于误差公式确定actor-criticDRL算法输出的目标动作与专家经验展示的loss值; 多智能体模块,其包括用以输出PID控制参数PID智能体和用以输出控制力矩的DDR智能体,两个智能体控制同一个机械臂; PID控制模块,其用以基于多智能体模块输出的PID参数输出力矩以控制机械臂,使机械臂跟踪不同于训练轨迹的其他轨迹; 奖励确定模块,其用以通过各智能体的对应奖励函数确定对应智能体的奖励值; 更新模块,其用以控制各智能体更新; 所述比例智能体模块用以确定TD3的目标策略输出目标动作的公式; a′s′=clipπφ′s′+clip∈,-c,c,alow,ahigh 其中,a’为目标动作,s’为根据当前动作作用于当前状态产生的下一个状态,πφ′s′为目标策略πφ′根据下一动作s’产生的目标动作,∈为添加的随机噪声,∈的值域为-c,c,alow,ahigh为目标策略输出目标动作的大小范围,clipa,b,c表示用范围b,c对a进行截断裁剪; TD3为孪生延迟深度确定性策略梯度算法,TD3为专适用于连续动作空间任务设计的非在线actor-criticDRL算法; 所述比例智能体模块用以确定Q,包括: 所述actor-criticDRL算法包括两个不同的用以对动作进行估计Q网络,所述比例智能体模块将两个Q值中最小的Q值确定为更新目标,以抑制持续地过高估计; 在actor-criticDRL算法中基于Q值求解公式确定Q值,Q值求解公式为, 其中,r为环境给的回报值,γ为折扣因子,是由双Q网络组成的critic神经网络,Qθ′i为网络参数为θ′的包含两个Q网络的critic神经网络; 所述比例智能体模块用以确定π,包括: 用以确定actor网络的更新公式,actor网络的更新公式为: 其中,为经验池,为actor网络在参数更新时的策略梯度,φ为网络参数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东莞理工学院,其通讯地址为:523808 广东省东莞市松山湖科技产业园区大学路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。