广东工业大学;广东能哥知识科技有限公司王涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东工业大学;广东能哥知识科技有限公司申请的专利一种控制模型的训练方法和机械臂控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117067202B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310996590.7,技术领域涉及:B25J9/16;该发明授权一种控制模型的训练方法和机械臂控制方法是由王涛;阮子明;程良伦设计研发完成,并于2023-08-08向国家知识产权局提交的专利申请。
本一种控制模型的训练方法和机械臂控制方法在说明书摘要公布了:本方案涉及一种控制模型的训练方法和机械臂控制方法,控制模型的训练方法包括:获取任务样本信息和状态样本信息,状态样本信息包括机械臂的状态样本信息和目标对象的状态样本信息,任务样本信息包括执行动作,将任务样本信息和状态样本信息输入裁决网络得到每一处理层的当层责任权重信号,将每一处理层的当层责任权重信号输入核心网络中对应的学习层,得到预测动作,根据当层责任权重信号、预测动作和状态样本信息更新核心网络的网络参数,根据预测动作和执行动作确定核心网络是否收敛,若核心网络未收敛,重复获取任务样本信息和状态样本信息,直至核心网络收敛。本发明可以加快了学习过程和决策过程,应用于机器人控制领域。
本发明授权一种控制模型的训练方法和机械臂控制方法在权利要求书中公布了:1.一种控制模型的训练方法,其特征在于,包括以下步骤: 获取任务样本信息和状态样本信息;所述状态样本信息包括机械臂的状态样本信息和目标对象的状态样本信息,所述任务样本信息包括执行动作; 将所述任务样本信息和所述状态样本信息输入裁决网络得到每一处理层的当层责任权重信号;所述裁决网络包括若干个处理层; 将每一处理层的当层责任权重信号输入核心网络中对应的学习层,得到预测动作;所述核心网络包括若干个学习层,所述核心网络的学习层与裁决网络的处理层一一对应,所述核心网络的在后学习层根据在前学习层更新; 根据所述当层责任权重信号、所述预测动作和所述状态样本信息更新所述核心网络的网络参数; 根据所述预测动作和所述执行动作确定所述核心网络是否收敛,若所述核心网络未收敛,重复获取任务样本信息和状态样本信息,直至所述核心网络收敛; 所述将所述任务样本信息和所述状态样本信息输入裁决网络得到每一处理层的当层责任权重信号,具体包括: 将所述任务样本信息通过一层全连接层进行第一学习,得到第一向量; 将所述状态样本信息通过两层全连接层进行第二学习,得到第二向量; 根据所述第一向量和所述第二向量得到每一处理层的当层责任权重信号; 所述根据所述第一向量和所述第二向量得到每一处理层的当层责任权重信号,具体包括: 将所述第一向量和所述第二向量相乘,得到所述裁决网络的第一输入,根据所述第一输入得到每一处理层的初始责任权重信号; 对每一处理层的初始责任权重信号进行归一化处理得到每一处理层的当层责任权重信号; 所述根据所述第一输入得到每一处理层的初始责任权重信号,具体包括: 将所述第一输入经过一层激活函数层和全连接层得到第一层处理层的初始责任权重信号; 对于所述裁决网络第一层之后的每一处理层,将所述第一输入和上一处理层的初始责任权重信号经过两层全连接层和激活函数层得到当前处理层的初始责任权重信号,直到得到每一处理层的初始责任权重信号; 所述将每一处理层的当层责任权重信号输入所述核心网络中对应的学习层,得到预测动作,具体包括: 根据所述状态样本信息得到所述核心网络的第一层学习层的输出; 根据所述第一层学习层的输出和第一层学习层的当层责任权重信号得到所述核心网络的第二层学习层的输出; 对于所述核心网络第二层之后的每一学习层,根据当前学习层的当层责任权重信号和在前学习层输出得到的当前学习层的输出,直到最后一层学习层输出预测动作;所述在前学习层输出包括当前学习层之前所有学习层的输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学;广东能哥知识科技有限公司,其通讯地址为:510062 广东省广州市东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励