一种基于DDQN的智能车间动态自适应调度方法及系统

导航：龙图腾网> 最新专利技术> 一种基于DDQN的智能车间动态自适应调度方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：广东工业大学

摘要：本发明提出一种基于DDQN的智能车间动态自适应调度方法及系统，涉及车间作业调度，首先以采集的车间生产作业数据作为历史大数据，构建基于数据状态的马尔科夫状态过程，设置训练数据样本，结合DDQN算法，基于样本训练当前目标Q网络得到训练好的深度目标Q网络，最大程度地贴合离散车间生产作业的实际情况。构建实时状态与深度目标Q网络交互自适应调度匹配执行机制，根据当下的实时数据状态进行匹配推演，生成调度策略对下一步作业进行指导，可快速响应车间的动态变化，进行“一步一推理”的自适用动态调度，高效地匹配合适的调度策略动作，极大地节约了时间成本的同时提高了生产的效率。

主权项：1.一种基于DDQN的智能车间动态自适应调度方法，其特征在于，所述智能车间为搭建了物联网环境的离散制造车间，由工件加工工位、车间物流节点及工件缓存区的制造节点组成，所述方法包括以下步骤：S1.采集车间生产作业数据；S2.对车间生产作业数据进行预处理，然后构建制造节点的多维数据状态，按时间序列顺序形成制造节点的马尔科夫状态视图，完成数据状态建模；S3.随机获取状态建模后的数据，每一条数据中存在表征离散制造车间的制造节点的当前数据状态S、基于当前数据状态S所采取的调度策略动作A、当前数据状态S执行调度策略动作A后的奖励R、制造节点的下一个数据状态S+1及车间生产作业过程的末状态D，然后一次选取k条数据作为样本；S4.确定基于DDQN的当前目标Q网络，以马尔科夫状态视图中制造节点的各个数据状态S作为当前目标Q网络的输入，以执行各个调度策略动作A的动作评估值Q作为当前目标Q网络的输出，基于样本训练当前目标Q网络，得到训练好的深度目标Q网络；S5.确定制造节点的实时数据状态S＇，将实时数据状态S＇作为训练好的深度目标Q网络的输入，得到基于当前实时数据状态S＇所预估的可选调度策略动作A＇以及实时数据状态S＇采用调度策略动作A＇进行调度作业所花费的时间T，并将时间T按照从小到大排序；S6.若时间T均不相等，将时间T最小时对应的调度策略动作A＇选定为最优调度策略动作，作为下一步执行的调度动作；若存在多个相等的最小时间T，选取动作评估值Q最大的调度策略动作A＇作为最优调度策略动作；S7.重复步骤S5～S6，动态更新调度策略，直至车间生产作业完成；步骤S1所述的采集的车间生产作业数据包括：车间操作工人的技术水平的数据、生产设备的工作状态的数据、待加工工件的信息数据、产品各种指标的精度和制造节点的上下游节点状态在内的“人、机、物、法、环”各种维度数据；步骤S2所述的采集的车间生产作业数据进行预处理的过程包括：清洗车间生产作业数据，处理车间生产作业数据中的错误值和缺失值，根据数据错误或缺失的情况，按行或按列删除；对于缺失值，根据在车间制造实际情况下的数据自身属性，采用均值或中位数或众数作为中心度量值来填补缺失数据；把有量纲的数据映射到无量纲的离散数据空间，即把车间生产作业过程中所得到的数据进行离散化处理；在不丢失所需要信息的前提下，把采集到的数据进行数字化、离散化、去单位化描述，构建无量纲的数据；步骤S2中所述的构建制造节点的多维数据状态，按时间序列顺序链接形成制造节点的马尔科夫状态视图的过程包括：采集的车间生产作业数据为多源异构数据，将采集的车间生产作业数据根据车间作业生产逻辑进行链接集成，通过以下方式的状态集合：单个制造节点状态维度1状态，维度2状态，维度3状态，......，维度i状态对车间中制造节点的多维数据状态进行表达，构建出每个制造节点的多维数据状态，每一个维度状态包括或部分包括了人力维度、物料维度、生产设备维度，工艺维度和环境维度的采集数据；其中，人力维度包括当前制造节点的操作工人的技能熟练度、监控人员的管理水平，物料维度包括订单工件编号、工件数目、及类型，生产设备维度包括生产设备的工作状态、类型、维护时间和忙闲情况；工艺维度包括加工精度、作业规范及产品标准，环境维度包括车间的生成上下文及自然环境因素；所有制造节点链接起来形成整个车间智能制造系统，将各个制造节点的多维数据状态映射到车间生产的所有制造节点中，从时间上截取车间制造过程中某一个瞬间的俯视全景数据视图，将各个制造节点基于某个瞬间的作业数据映射，把所有车间制造节点和各种“人、机、物、法、环”约束维度一一映射，对每一个制造节点进行编号，通过以下方式的状态集合：智能制造系统状态制造节点1的状态，制造节点2的状态，......，制造节点j的状态把包含所有制造节点整个智能制造系统的数据状态表示出来；将整个智能制造系统的数据状态视图根据车间生产作业过程的各个瞬间逐个表达出来，按照时间序列顺序连接，通过以下方式的时间序列顺序：智能制造系统马尔科夫状态过程系统的状态T1，系统的状态T2，......，系统的状态Tk将智能制造系统制造节点的各个维度状态数据信息串联起来，形成符合车间生产顺序的数据状态，得到完整车间生产过程中制造物联网映射的马尔科夫状态视图及其状态演变；离散制造车间的制造节点的当前数据状态S包括制造节点的忙闲状况、容量、忙时状态的节点正在操作的订单的数目以及订单编号；离散制造车间的制造节点的各个数据状态S按时间顺序串联成为完整的智能制造系统马尔科夫状态过程；调度策略动作A表达为JOBID,MNID，其中，JOBID表示某个订单编号的作业，MNID是某一个编号的节点，表达当前某一个作业JOBID在调度时选择在节点MNID上进行加工、流转或等待；步骤S4所述的基于DDQN的当前目标Q网络包括负责动作获取的现实网络Current_Net和负责动作价值计算的目标网络Target_Net，现实网络Current_Net和目标网络Target_Net结构相同；以马尔科夫状态视图中制造节点的各个数据状态S作为当前目标Q网络的输入，以执行各个调度策略动作A的动作评估值Q作为当前目标Q网络的输出，各个调度策略动作A的动作评估值Q组成Q值表，某一调度策略动作A的动作评估值Q越大，调度策略动作的价值越大，合理性越高；当前目标Q网络的训练过程为：将样本i，i∈1，k中制造节点的下一个数据状态S+1分别输入现实网络Current_Net和目标网络Target_Net，得到Cur_Q值表和Tar_Q值表；获取样本i，i∈1，k在Cur_Q值表中动作评估值Q最大的索引动作，再利用该索引动作检索Tar_Q值表，得到对应调度策略动作的Tar_Q值；创建存储k条样本Q值数据的列表Q_batch，每条样本按照：Qi＝样本i的奖励Ri+GAMMA*样本i对应的Tar_Q值分别计算对应的Q值并载入列表Q_batch中，用于损失函数计算；将k条样本中的当前数据状态S输入现实网络Current_Net，得到当前状态S,A的现实Q值，同时将k条样本所得k个现实Q值存入Current_Net_Q列表，用于损失函数计算；设损失函数Cost为：Cost＝Q_batch-Current_Net_Q利用优化器对损失函数进行优化计算，直至收敛；训练过程中，更新当前目标Q网络的频率为f，将现实网络Current_Net的参数每训练f步，更新一次目标网络Target_Net的参数，得到训练好的深度目标Q网络。

全文数据：

权利要求：

百度查询：广东工业大学一种基于DDQN的智能车间动态自适应调度方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：写请求的处理方法、装置、设备和介质

下一篇：一种Z型气动吸附的执行器结构

相关技术

写请求的处理方法、装置、设备和介质

一种Z型气动吸附的执行器结构

一种重型机械龙门自动焊接装置

电池单体、储能设备及用电装置

一种人脸识别环卫作业电子工牌

单电池气密流阻测试工装结构

用于机动车的前照灯

一种多能源能量调度系统及调度控制方法

一种多自由度解耦的波浪能发电装置及其工作方法

一种接地线缆开关状态检测装置和检测方法

一种惯性传感器探头装置及多自由度检测方法

一种烟叶分拣定级用的翻转分料装置及方法

动态相关技术

近红外多波长窄带面状发光装置及动态动态塑料分类方法_杭州电子科技大学_202410762203.8

动态权限控制方法及装置_合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)_202410592128.5

一种动态螺杆阀_深圳市欣音达科技有限公司_202323590035.9

电池充电的动态控制_通用汽车环球科技运作有限责任公司_202311418752.5

利用动态气缸启动动态确定发动机点火模式的方法及实施该方法的系统_普渡研究基金会_202080073869.2

一种在线动态混合器_廊坊市冠通机械有限公司_202411022017.7

全方位激光3D动态投影方法_长春理工大学_202311152446.1

经动态调整废料收集工作量_美光科技公司_202010928134.5

微小动态力测试系统及方法_上海空间推进研究所_202410760949.5

电池充电的动态和预测控制_通用汽车环球科技运作有限责任公司_202311411614.4

自适应相关技术

自适应多路径调度器_罗伯特·博世有限公司_202310238374.6

自适应无线扫描管理系统_康尔福盛303公司_202280090481.2

自适应前照灯光束_通用汽车环球科技运作有限责任公司_202311414497.7

一种自适应夹具_华洋海纳(北京)科技有限公司_202411116699.8

一种自适应送料机构_巨力索具股份有限公司_202323518631.6

自适应参考信号信令_高通股份有限公司_202280088129.5

系统信息的自适应通信_联想(新加坡)私人有限公司_202380020652.9

自适应风向风力发电装置_左臣伟_202420286184.1

自适应放缆设备及放缆车_广东电网有限责任公司广州供电局_202410770591.4

自适应环内滤波方法和设备_韩国电子通信研究院_202410671432.9

调度相关技术

物流调度方法及系统_荣成歌尔微电子有限公司_202410589316.2

交易调度方法及装置_创新先进技术有限公司_202110065073.9

资源调度策略的确定方法、调度器和电子设备_中国邮政储蓄银行股份有限公司_202410724641.5

一种多能源能量调度系统及调度控制方法_中科嘉鸿(佛山市)新能源科技有限公司_202411119617.5

自适应多路径调度器_罗伯特·博世有限公司_202310238374.6

地面作业指挥数据调度处理方法_北京风云气象科技发展有限公司_202410753755.2

调度器队列分配突发模式_超威半导体公司_202080085224.0

资源调度方法及电子设备_华为技术有限公司_202310271542.1

面板套件及空气调度设备_奥普智能科技股份有限公司_202323190045.3

跨载波调度方法和通信装置_华为技术有限公司_202310248949.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于DDQN的智能车间动态自适应调度方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务