Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种大跨度桥梁施工资源调度优化方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:四川公路桥梁建设集团有限公司

摘要:本发明属于工程项目智能优化调度技术领域,特别是涉及一种大跨度桥梁施工资源调度优化方法。针对大跨度桥梁施工涉及任务多、约束复杂、资源种类多等特点,本发明在深度强化学习模型的基础上,引入了任务‑资源联合编码策略,设计了多目标学习范式,嵌入了工程领域知识约束条件,在显著提升调度效率和解的质量的同时,实现了工期、成本等多目标的动态权衡。有望显著提升行业的信息化、智能化水平,具有良好的应用前景。

主权项:1.一种大跨度桥梁施工资源调度优化方法,其特征在于,所述方法包括如下步骤:步骤1:建立任务-资源二元组编码,具体为:将每个施工作业定义为一个"任务-资源需求"原子单元,任务属性和资源占用情况同时编入特征向量,增强特征表达能力,第个任务与第类资源的二元组特征为: ;其中,为第个任务的固有属性特征向量,包含工期、紧前紧后逻辑关系静态信息;为第类资源的固有属性,包含资源数量、单位成本信息;为第个任务对第类资源的需求量;和分别为第个任务的最早开始和最晚开始时间;步骤2:构建基于编码器-解码器结构的深度强化学习网络,具体包括:以步骤1得到的任务-资源二元组特征为输入,设计一个端到端的神经网络模型,用于从原始调度问题直接生成优化的调度决策序列,该网络包括两个模块:编码器和解码器;编码器:采用多层双向LSTM网络,将输入的二元组特征序列映射为一组潜在语义特征;解码器:采用多层LSTM网络,将编码器输出的特征向量解码为一系列调度决策动作,并引入注意力机制动态聚焦不同任务;步骤3:引入多目标强化学习范式,具体包括:所述多目标强化学习范式根据实际需求动态权衡不同目标将网络的输出拓展为两个并列支路,分别对应工期优化和成本优化,表示为: ;其中,和分别为时刻工期优化支路和成本优化支路选择的调度决策,和为两个支路的状态,和为参数化的决策策略;具体来说,定义环境状态为,其中: :各任务在时刻的完成状态,已完成为1,否则为0; :各任务的实际开始时间,未开始的任务为0; :种资源在时刻的累计占用量; :当前调度时刻,初始;将解码器在时刻的隐状态分别输入两个独立的多层感知机和,生成关于工期和成本的任务开始概率分布和: ;对于工期优化支路,每个时间步的决策后,环境状态按如下规则转移: ;其中,为各任务单元的资源需求矩阵;同时环境反馈即时奖励: ;对工期优化支路的策略网络采用REINFORCE算法训练,其目标为最大化期望累积奖励: ;其中为一条完整的状态-行动轨迹;对于成本优化支路,环境反馈的即时奖励为每个时间步新增资源占用的成本: ;其中为各类资源的单位成本,优化目标为最小化总成本,即最大化成本的负值的期望累积奖励: ;两个支路的策略网络分别进行训练,并定期在连接层进行参数平均,为奖赏衰减因子;步骤4:嵌入领域知识约束条件,具体为:(1)任务先序关系约束:将任务单元间的技术逻辑关系表示为有向无环图(DAG),构建邻接矩阵;当任务必须在任务完成后才能开始时,令;将作为环境状态的一部分,引入状态转移约束: ; 表示在时刻对个任务的调度决策向量,其中为第个任务在时刻是否开始; 表示任务之间的依赖关系邻接矩阵,其中当且仅当任务依赖任务完成,否则;为的转置; 表示各任务在时刻的执行状态向量,其中表示任务已完成,表示任务尚未完成;上式确保了在时刻,仅当任务的所有紧前任务都已完成,其开始概率才能非零;同时在奖励函数中设置DAG约束惩罚项: ;若调度决策违反DAG约束,即存在未完成的紧前任务,则奖励值会受到惩罚;上述两种方式协同引导agent遵循施工工序逻辑;(2)资源占用约束,设计一种基于资源占用冲突的惩罚机制,对超限决策的即时奖励进行修正: ;当时刻的调度决策使得下一时刻的资源占用量超出约束时,即时奖励将受到惩罚,其中表示惩罚强度;这一设计迫使agent在有限的资源约束内优化调度,避免生成不可行的决策序列;(3)目标值估计,将基于关键路径法计算的最短工期和最低成本分别作为工期和成本优化的下界,纳入奖励函数中:当实际工期或实际成本优于下界时,在即时奖励中引入额外的正向激励;工期支路的即时奖励修正为: ;成本支路的即时奖励修正为: ;其中为激励系数;步骤5:训练与推断,具体为:首先利用蒙特卡罗方法对梯度进行采样估计,然后基于策略梯度定理对网络参数进行更新;经过多轮迭代后,两个支路的策略网络将收敛到平衡工期和成本的最优解集;基于训练好的策略网络,分别从工期优化和成本优化的角度对新的调度问题进行推断决策。

全文数据:

权利要求:

百度查询: 四川公路桥梁建设集团有限公司 一种大跨度桥梁施工资源调度优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。