北京理工大学王钢获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种基于竞争式元强化学习的作业车间调度方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119443577B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411398008.8,技术领域涉及:G06Q10/0631;该发明授权一种基于竞争式元强化学习的作业车间调度方法和系统是由王钢;翁博熙;孙健;陈杰设计研发完成,并于2024-10-09向国家知识产权局提交的专利申请。
本一种基于竞争式元强化学习的作业车间调度方法和系统在说明书摘要公布了:本发明公开了一种基于竞争式元强化学习的作业车间调度方法和系统,首先,构造含有多个不同调度任务类型的任务库,并随机初始化多个调度模型。在每个训练周期,为各调度模型随机抽取一个任务环境,通过行为策略网络与环境的交互生成支持集,并进行模型参数的内环适应性更新。然后,再与一个新环境交互生成查询集,并进行外环元参数更新。最后,基于竞争评价函数比较各调度模型的学习效果,辨别本轮训练中评估最佳的调度模型,并使其他模型的参数朝其参数方向靠拢。重复上述过程,直到训练完成获得多个优质的调度模型。本发明帮助调度模型快速适应不同任务,提高了其自主决策和持续优化能力,对求解现实中复杂、动态的调度问题具有非常重要的意义。
本发明授权一种基于竞争式元强化学习的作业车间调度方法和系统在权利要求书中公布了:1.一种基于竞争式元强化学习的作业车间调度方法,其特征在于,包括: 生成多样化的任务库,通过随机设置不同的问题规模、处理时间分布和问题类型,使任务库中含有多种不同类型的调度任务所对应的车间环境;调度任务由作业集合和机器集合构成,每个作业包含一系列操作;所述问题规模指一个作业车间调度问题中所包含机器数量与作业数量的乘积;所述处理时间分布指一个操作在对应机器上处理完成所需的处理时间在初始化车间环境时随机采样所依据的随机分布类型;所述问题类型指初始化车间环境时对求解问题的设置类型; 构建调度模型,调度模型包括基于Actor-Critic框架的决策模型所设置的策略网络πθ、行为策略网络πθold和评价网络νφ;策略网络πθ中的参数θ和评价网络vφ中的参数φ组成调度模型的参数Θ={θ,φ}; 并行训练多个调度模型: 在训练中,对于每个调度模型,从任务库中随机抽取一个调度任务使用所述行为策略网络πθold与环境交互生成支持集基于支持集进行元学习训练,计算内环损失,并基于内环损失进行调度模型的参数更新;更新后的参数记为Θ′i={θ′i,φ′i};i表示调度任务的序号; 当针对特定调度任务的内环迭代次数达标,对于每个调度模型,各自利用在各任务上更新后的参数Θ′i构建新参数的策略网络与环境交互生成查询集基于查询集进行元学习训练,计算外环损失和元梯度,并对调度模型进行外环元更新; 选取本周期训练中的最佳调度模型,标记为优选者,其余为失败者;优选者参数保持不变;所有失败者的参数向优选者的参数方向更新; 进行多个周期的训练,最终得到具有较好学习效果的调度模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励