首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种订单随机到达的不稳定混合作业车间动态调度方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东南大学

摘要:本发明公开了一种订单随机到达的不稳定混合作业车间动态调度方法及系统,在模型建立阶段,建立端到端的马尔可夫决策过程,通过设置基于阶段的多个智能体,避免大规模问题因素下的动作和状态空间快速膨胀,保证合理训练时间。在Q‑网络训练阶段,设置记忆回放缓冲区机制以收集训练数据,根据订单到达时间和机器故障时间判断重调度时机,利用基于贪婪规则的动作选择策略实现状态空间的充分探索,引入双层动作空间确定操作执行顺序和位置。在Q‑网络测试阶段,输入一定规模测试算例,利用训练完成的网络,产生解决方案。本发明旨在最小化最大完工时间和总能耗,在智能制造领域有广泛的应用价值和使用前景。

主权项:1.一种订单随机到达的不稳定混合作业车间动态调度方法,其特征在于:至少包含模型建立阶段、Q-网络训练阶段、Q-网络测试阶段;A.模型建立阶段:将调度问题建模为基于多智能体的马尔科夫决策过程MDP,表示为MS,A,P,R;其中,S代表智能体在环境中的实时状态,A表示动作的集合,P给出状态S采取动作A后的状态转移概率分布,R作为回报或奖励,发生在状态执行动作之后;通过设置基于阶段的多个智能体,避免动作和状态空间快速膨胀,保证训练时间;B.Q-网络训练阶段:结合Q-目标值网络,设计基于奖励的损失函数并利用经验重放机制,完成输入为状态特征、输出为动作选择概率的Q-当前值网络参数的训练;所述训练过程中,设置记忆回放缓冲区机制以收集训练数据,根据订单到达时间和机器故障时间判断重调度时机;引入双层动作执行策略确定操作执行位置和顺序;利用基于贪婪规则的动作选择策略实现状态空间的充分探索;C:Q-网络测试阶段:输入测试算例后,在每个阶段根据操作的到达时间,动态的利用训练好的神经网络进行操作和机器的选择,执行多次直到所有操作加工完成。

全文数据:

权利要求:

百度查询: 东南大学 一种订单随机到达的不稳定混合作业车间动态调度方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术