基于深度强化学习的云订单动态接受与调度方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明公开了一种基于深度强化学习的云订单动态接受与调度方法，按如下步骤：步骤一，接单智能体根据车间的信息反馈，以最大利润为目标制定订单接受策略；步骤二，当云订单接受后，排单智能体将当前时刻剩余工序和云订单以最小拖期时间和最小扰动为整合目标重调度；调度结束后将车间的生产能力反馈给接单智能体。本发明可对动态到达的云订单实现调度优化，能在正常生产自有订单的同时提高车间资源利用率，提升企业的利润。

主权项：1.基于深度强化学习的云订单动态接受与调度方法，其特征是按如下步骤：步骤一，接单智能体根据车间的信息反馈，以最大利润为目标制定订单接受策略；步骤二，当云订单接受后，排单智能体将当前时刻剩余工序和云订单以最小拖期时间和最小扰动为整合目标重调度；调度结束后将车间的生产能力反馈给接单智能体；步骤一中，利润的目标函数如下：其中，pb、v、db、Fb、cb分别表示第b个云订单的价格、单位延期时间的惩罚因子、延期时间、固定生产成本，机器生产成本；pQ、dQ、FQ、cQ分别表示第Q个自有订单的价格、延期时间、固定生产成本、机器生产成本，其中，b＝1，2,…g，Q＝1，2，…h；车间调度中，所有订单延期累计时间最小目标函数为：车间生产扰动最小的目标函数为新旧调度方案的工序加工时间差异累和：式中，表示第z个订单的第w道工序新调度与旧调度方案的开始加工时间差值，表示第z个订单的第w道工序新调度方案与旧调度的结束加工时间差值；其中，z＝1,2,…L，w＝1,2,…u；使用马尔科夫决策过程GS,A,P,R,γ来描述云订单动态调度问题，其中包括状态空间S、动作空间A、状态转移概率P、奖励函数R、折扣因子γ；步骤一中，接单智能体的奖励函数接单智能体以利润最大化作为目标函数，而生产每个订单都会有对应的价格、固定成本、机器加工成本以及延期成本，接单智能体需要通过车间的状态判断接受云订单是否存在利润，奖励函数设计如下：步骤二中，排单智能体的奖励函数接受订单后，排单智能体将新订单插入生产时，会对已有订单的生产安排造成影响，不仅需要考虑订单延期问题，还需要考虑新插入订单的扰动问题；因此，排单智能体以订单最小延期和订单插入最小扰动双目标整合作为目标函数；上式中，每个动作的延期奖励计算方法为，当工件未完成时，以该工序的最迟开始时间作为标准计算延期时间，当该工件完成时，则以工件的交货期为准计算延期时间；式中，S是自有订单和云订单的累和总计订单数量，r1代表接单智能体在决策时刻tk-1转移至tk的奖励值；证明得到，最小化订单延期时间等于最大化奖励函数上式中，tj表示第j个订单的延期时间，其中，j＝1,2,…S；将云订单插入生产时，会造成机器设备、人员、物料的变动，因此在决策时，期望订单整体的安排与之前的生产的差异最小；整体的差异通过各工件的每道工序的开始时间和结束时间的差值计算得到，工序生产的时间差异作为回报反馈给排单智能体；将单步奖励转化为整体目标函数：新调度方案与旧调度方案的订单生产安排差异越小，车间扰动也就越小，得最小化订单插单生产扰动等于最大化奖励函数当有新订单进入，排单智能体进行新一次调度安排时，最终的回报将权衡整合奖励函数r1和r2；采用加权法对两个目标整合，需要对奖励函数先进行归一化，方法如下：由于拖期奖励函数的最值和订单扰动函数的最值未知，所以设定为：拖期奖励函数值r1max＝0，订单扰动函数值其中，C1，C2是较小的负数，且小于所有的奖励函数值；将两个目标转化为单目标优化问题：上式中，we代表第e个目标的权重，r′e代表第e个目标值经过归一化处理后所得的值，其中，e＝1,2。

全文数据：

权利要求：

百度查询：杭州电子科技大学基于深度强化学习的云订单动态接受与调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：酿造结构及酿造装置

下一篇：一种高压电缆分支箱的电缆分布卡紧装置

相关技术

酿造结构及酿造装置

一种高压电缆分支箱的电缆分布卡紧装置

一种建筑造价测绘装置

断路器系统

一种降解包装材料的流延加工设备

一种舞台道具快速更换装置

一种PE管生产韧性检测设备

一种防堵塞的水泵

一种冷料仓下料自动补偿装置

一种防护服抗穿刺测试装置

一种儿童心血管数据集成及智能归档系统

一种便于滑道清理的铝合金门窗

订单相关技术

一种订单信息的展示方法和装置_北京京东振世信息技术有限公司_202310575312.4

订单处理方法、装置、介质与电子设备_北京京东乾石科技有限公司_202310558674.2

处理订单的方法和电子设备_上海桔晟科技有限公司_202310540182.0

外卖订单动态扩散时长的预测方法和装置_浙江鸟潮供应链管理有限公司_202411091110.3

订单信息处理系统及处理方法_重庆登康口腔护理用品股份有限公司_202411257347.4

一种搬家订单匹配方法、装置及电子设备_北京蓝犀牛信息技术有限公司_202411013143.6

一种基于智能机器人的电商订单智能管理平台_杭州吉客云网络技术有限公司_202411097237.6

一种基于标准差动态阈值的支付订单异常检测方法_天翼视讯传媒有限公司_202411199294.5

基于深度强化学习的云订单动态接受与调度方法_杭州电子科技大学_202111085349.6

一种基于跨境贸易的订单实际成本监控系统_广东拓威天海科技股份有限公司_202410473249.8

动态相关技术

立体动态塔板_天津市普莱特科技发展有限公司_202010113724.2

动态负载电路_深圳市辰卓科技有限公司_202323668980.6

动态称重设备_梅特勒-托利多(常州)精密仪器有限公司_201911023945.4

动态双向调节式伸缩连接杆及动态调节机构_杭州华一强实业有限公司_202411473667.3

一种基于动态半影模型的动态调强装置及优化方法_中科超精(南京)科技有限公司_202210985163.4

一种动态表单涉及更改项动态加载配置的方法_南京维拓科技股份有限公司_202210947683.6

不依赖参数模型的基于动态矩阵控制的动态推力重建方法_上海交通大学_202411098801.6

一种风力动态景观装置_上海喜随景观设计咨询有限公司_202420722697.2

针对动态相关的微型扫描_霍尼韦尔国际公司_202410450419.0

颈后路动态固定装置_上海交通大学医学院附属第九人民医院_201910257187.6

云相关技术

一种用于云台吊舱的密封结构和云台吊舱_广东科凯达智能机器人有限公司_202010388912.6

云台控制方法、装置、云台控制设备及存储介质_重庆市亿飞智联科技有限公司_202111465275.9

一种酒店云服务系统及云服务方法_广东趣看看信息技术有限公司_202411037776.0

基于云计算的云平台数据安全处理方法及系统_华源云(深圳)网络科技有限公司_202410974169.0

点云配准方法、点云配准质量检测方法、电子设备、介质_深圳元戎启行科技有限公司_202411079686.8

一种基于云计算的数字空间孪生云靶场构建方法及系统_中电运行(北京)信息技术有限公司_202411225145.1

智慧停车云服务系统及方法_江西达途数字技术有限公司_202411216560.0

一种云音柱_联通(江西)产业互联网有限公司_202422557027.2

云手机的号码登录方法_中移互联网有限公司_202411168571.6

商用车故障云诊断方法_安徽省爱夫卡电子科技有限公司_202410996201.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于深度强化学习的云订单动态接受与调度方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务