Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东华大学张朋获国家专利权

东华大学张朋获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东华大学申请的专利一种基于多智能体强化学习的机器人集群韧性调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120697001B

龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510760590.6,技术领域涉及:B25J9/16;该发明授权一种基于多智能体强化学习的机器人集群韧性调度方法是由张朋;李洪森;张洁;王德贤;丁鹏飞设计研发完成,并于2025-06-09向国家知识产权局提交的专利申请。

一种基于多智能体强化学习的机器人集群韧性调度方法在说明书摘要公布了:本发明提出一种基于多智能体强化学习的机器人集群韧性调度方法,考虑车间的复杂特征以及考虑设备故障冲击对调度系统的影响,将韧性理论融入到焊接生产调度问题中,通过加入预防性维护和纠错性维护来提升系统韧性,通过构建多智能体强化学习的算法框架使用值分解结合多智能体演员‑评论家算法对每个智能体进行信用分配,实现焊接车间韧性调度系统应对设备故障冲击的响应恢复能力。

本发明授权一种基于多智能体强化学习的机器人集群韧性调度方法在权利要求书中公布了:1.一种基于多智能体强化学习的机器人集群韧性调度方法,其特征在于,包括以下步骤: 根据机器人集群工作场景,将加工过程中机器人和工件相关信息作为状态空间,将加工和预防性维护过程中相关指令作为动作空间,将任务完成度、机器人空闲度、预防性维护、纠错性维护、机器人故障情况作为奖励函数,构建多智能体强化学习算法环境;任务完成度根据任务的完成情况给予奖励,完成的越好奖励越高,机器人空闲度指机器人空闲和总时间的比例,空闲度越高奖励越低,机器人故障情况指的是机器人故障、触发故障给予重罚,预防性维护也需要消耗时间,太多的预防性维护会影响加工,也需要给予适当的处罚避免其过多的预防性维护,纠错性维护用于描述机器人故障后进行维修恢复其可靠性; 奖励函数的设计基于最小化最大完工时间设置奖励函数,主要考虑正在加工,繁忙空闲和维护三部分设计奖励,将其分解到加工的每一步中分为三部分,所述奖励函数如下: 第一部分如下: 式中,为正在加工时,所有工件在各机器的加工和; 第二部分如下: 式中,是t时刻机器繁忙空闲状态的函数, 第三部分如下: 式中,T为预防性维护时间,Tc是纠错性维护时间,是在时间[tj-1,tj]内预防性维护次数,是在时间[tj-1,tj]内纠错性维护次数; 根据状态空间、动作空间和奖励函数,训练每个机器人相对应的独立演员网络和评论家网络以及VDAC网络,得到训练后演员网络、训练后评论家网络和训练后VDAC网络; 训练后演员网络根据机器人的加工工件状态信息和其他机器人状态,计算在当前观测下的机器人采取的各个可能动作的动作概率分布,训练后评论家网络根据加工工件状态信息、演员网络的动作概率及所选动作,计算每个机器人在当前观测下的状态价值,通过训练后VDAC网络计算出总价值进行信用分配,并根据信用分配结果通过反向传播训练评论家网络以实现信用分配调度策略更新,并得到动作优势更新训练后演员网络中神经网络参数; 将训练好的神经网络加载到多智能体机器人韧性调度系统中,根据状态信息和要求进行协同调度。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东华大学,其通讯地址为:200051 上海市长宁区延安西路1882号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。