一种基于深度强化学习的柔性车间作业动态调度方法

导航：龙图腾网> 最新专利技术> 一种基于深度强化学习的柔性车间作业动态调度方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：河南科技大学

摘要：本发明公开了一种基于深度强化学习的柔性车间作业动态调度方法，属于车间作业动态调度领域，该方法包括以作业总拖期时间最小化、作业最大完成时间最小化和平均机器利用率最大化为优化目标，得到多目标模型；利用析取图模型对动态作业车间调度问题进行抽象，得到调度状态；根据调度状态和多目标模型，以优化目标为高层智能体，以作业和机器为低层智能体，利用马尔可夫决策过程，得到作业调度模型；获取新作业集合，并根据新作业集合，利用作业调度模型，得到调度计划表，完成柔性车间作业动态调度。本发明解决了现有技术中依赖调度规则而缺乏泛化性的问题。

主权项：1.一种基于深度强化学习的柔性车间作业动态调度方法，其特征在于，包括以下步骤：S1、以作业总拖期时间最小化、作业最大完成时间最小化和平均机器利用率最大化为优化目标，得到多目标模型；所述步骤S1中多目标模型的表达式为：其中，为多目标模型；为最小化函数；为作业总拖期时间；为作业编号；为作业数量；为最大化函数；为第个作业完成所有操作的时间；为第个作业的总操作数；为第个作业的作业超期时间；为第个作业完成所有操作的最大完成时间；为平均机器利用率；为机器数量；为机器编号；为第个作业的操作编号；为第个作业的第个操作在第个机器的加工时间；为第个作业的第个操作是否可以在第个机器进行的标识符，如果可以，为1，否则，为0；为环境当前时刻；S2、利用析取图模型对动态作业车间调度问题进行抽象，得到调度状态；所述步骤S2中调度状态的表达式为：其中，为调度状态；为操作节点；为机器节点；为有向弧；为无向弧；为优化目标节点；为第个作业的第个操作；为作业编号；为第个作业的操作编号；为处理时间为零的虚拟开始节点；为结束节点；S3、根据调度状态和多目标模型，以优化目标为高层智能体，以作业和机器为低层智能体，利用马尔可夫决策过程，得到作业调度模型；所述步骤S3具体为：S301、获取实例数据；S302、根据实例数据、调度状态和多目标模型，以优化目标为高层智能体，以作业和机器为低层智能体，利用马尔可夫决策过程对高层智能体和低层智能体进行训练，得到作业调度模型；所述步骤S302具体为：S3021、对实例数据进行取样，得到取样数据；S3022、以优化目标为高层智能体，以作业和机器为低层智能体；S3023、根据高层智能体和低层智能体，基于调度状态和多目标模型进行目标选择，得到待优化目标；S3024、利用调度状态，进行操作和机器对选择，得到操作机器对；S3025、根据操作机器对，利用局部搜索法，更新操作机器对中操作的开始时间和结束时间；S3026、根据待优化目标、操作机器对和操作机器对中操作的开始时间和结束时间，分别更新高层智能体的状态和低层智能体的状态；S3027、根据待优化目标，计算奖励；S3028、判断取样数据中所有需要进行加工的操作是否都已完成调度，并被安排到相应的机器上，若是，直接进入步骤S3029，否则，返回步骤S3023；S3029、根据奖励、高层智能体的状态和低层智能体的状态，采用近端策略优化算法，更新高层智能体的网络参数和低层智能体的网络参数；所述近端策略优化算法中策略网络的损失函数和评论家网络的损失函数的表达式分别为：其中，为策略网络的损失函数；为最小化函数；为概率比；为时刻的优势函数；为时刻；为裁剪函数；为裁剪参数；为评论家网络的损失函数；为奖励；为评论家网络的输出函数；为智能体的新状态；为智能体时刻的状态；为新策略；为智能体时刻的动作；为新策略对应的智能体网络参数；为旧策略；为旧策略对应的智能体网络参数；为时刻的折扣因子；为时刻的奖励；为所有时间步；为时刻；所述智能体可为高层智能体或低层智能体；S30210、判断第一公式是否成立，若是，对高层智能体和低层智能体进行验证，得到策略验证结果，并进入步骤S30211，否则，直接进入步骤S30211；所述第一公式的表达式为：其中，为迭代次数；为取余；为验证阈值；S30211、判断第二公式是否成立，若是，返回步骤S3021，否则，直接进入步骤S30212；所述第二公式的表达式为：其中，为取样阈值；S30212、判断第一等式是否成立，若是，直接进入步骤S30213，否则，返回步骤S3022；所述第一等式的表达式为：其中，为最大迭代阈值；S30213、设置观察区间，并判断策略验证结果是否在观察区间内收敛，若是，结束训练，得到作业调度模型，否则，调整高层智能体的超参数和低层智能体的超参数，并返回步骤S3022；S4、获取新作业集合，并根据新作业集合，利用作业调度模型，得到调度计划表，完成柔性车间作业动态调度。

全文数据：

权利要求：

百度查询：河南科技大学一种基于深度强化学习的柔性车间作业动态调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种测定食品中钩吻生物碱的方法

下一篇：置信度计算方法、装置、电子设备及计算机可读存储介质

相关技术

一种测定食品中钩吻生物碱的方法

置信度计算方法、装置、电子设备及计算机可读存储介质

AI车牌识别无人值守智能终端

一种变分量子线路的构造方法、装置、介质及电子装置

一种多线程的VCD文件数据统计工具及其应用方法

一种虫情测报模型的训练方法、装置、介质和计算设备

用于电气HV连接的触头组件

一种基于边缘计算的污染排放多源监测分析系统及方法

一种基于光子膜实现LED屏的三维立体光学展示系统及方法

一种季铵盐化合物、盐型及其应用

用于深度学习网络的优化方法及运算系统

基于动态尾流蜿蜒模型的风机状态评估方法、装置及存储介质

车间相关技术

硫化车间用环保吸尘装置_宁国市加能密封件有限公司_202420472015.7

一种速凝剂车间废气冷凝设备_云南山峰工贸有限公司_202420165918.0

焦炉车间轨道式智能巡检机器人系统_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202410277713.6

一种炼钢车间用抑尘装置_马鞍山奥柯环保科技发展有限公司_202323650481.4

一种钢结构车间龙门焊接装置_潍坊居佳集成房屋股份有限公司_202323376746.6

一种粉饼原料车间储存罐_上海乐宝日化股份有限公司_202420318613.9

一种茶树加工车间除尘控温系统_竹山县宜品茶业有限责任公司_202420513995.0

一种对虾室内车间高盐度养殖方法_渤海水产育种(海南)有限公司_202310157906.3

一种双向加强型车间地面格栅_枣庄市正邦新型建材有限公司_202323510865.6

一种喷涂车间隔热线生产设备_山东天衢铝业有限公司_202420449801.5

作业相关技术

作业机械_日立建机株式会社_202380025825.6

作业机_工机控股株式会社_202380023559.3

作业车辆_井关农机株式会社_201811460163.2

作业车辆、作业车辆的控制装置及控制方法_株式会社小松制作所_201980071676.0

电动作业机_株式会社牧田_202410518932.9

水上作业平台_武汉鼎盛力华工程技术有限公司_202420226107.7

一种作业平台_山西横炮专用汽车有限公司_202422058994.4

特种作业紧线器_中国人民解放军63921部队_202410884985.2

带电作业机器人和带电作业系统_广西电网有限责任公司百色供电局_202411023894.6

生产线可视化作业系统、作业方法及整车生产系统_一汽丰田汽车有限公司_202410790865.6

柔性相关技术

柔性电子装置_三星电子株式会社_202380030088.9

柔性定位装置、系统_智云流形科技(江阴)有限公司_202323498759.0

柔性取压结构_江苏唯侓机器人科技有限公司_202323422066.3

柔性洗墙灯_广东勤丽光电有限公司_202420700776.3

柔性戳放整理机构_唐山学院_202011135483.8

电极定制柔性密封罩_湖北辽鑫新材料科技有限公司_202420558645.6

手术盒柔性夹持机构_思埃然医疗科技(苏州)有限公司_202411004590.5

一种柔性珠宝_施华洛世奇制造(泰国)有限公司_202190000971.X

可调式导轨柔性挂件_贵州建工集团第四建筑工程有限责任公司_202323469115.9

一种柔性真空绝热板的制备方法和柔性真空绝热板_福建赛特新材股份有限公司_202411127193.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度强化学习的柔性车间作业动态调度方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务