买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及精馏塔控制与优化技术领域,具体为化工精馏塔优化控制方法,包括构建带积分形式的目标优化函数和约束条件,并利用TD3深度强化学习算法处理目标优化问题。构建仿真环境、智能体的观测空间和动作空间,利用所述带积分形式的目标优化函数和约束条件构建奖励函数,构建衰减专家经验回放池,引入信息补偿机制构建智能体的网络结构。训练智能体,直到累计奖励收敛;获取训练后的智能体,用于对所述精馏塔的优化控制。本发明利用强化学习算法处理精馏塔优化控制问题,可将训练好的智能体直接应用于精馏塔的优化控制,控制精馏塔迅速达到平衡状态,提高工作效率。
主权项:1.化工精馏塔优化控制方法,其特征在于,包括:带积分形式的目标优化函数和约束条件,公式为: 其中,f表示综合函数,T表示运行时间,ΔEt表示t时刻热量变化,Nt表示t时刻塔顶产品浓度,ΔTDt表示t时刻精馏段温差,ΔTBt表示t时刻提馏段温差,ΔWt表示t时刻物料变化,ΔPt表示t时刻塔底和塔顶压力差;TD3算法处理目标优化问题,包括:仿真环境,用于智能体和环境交互产生经验;观测空间和动作空间;利用所述目标优化函数和所述约束条件构建奖励函数;衰减专家经验回放池;引入信息补偿机制,用于构建动作网络和评价网络;在仿真环境中训练所述智能体,包括:步骤S601:初始化Actor网络、第一Critic网络和第二Critic网络的参数,初始化目标Actor网络、第一目标Critic网络和第二目标Critic网络的参数;步骤S602:所述智能体和所述仿真环境交互产生所述经验,将所述经验存入所述衰减专家经验回放池;步骤S603:从所述衰减专家经验回放池采样,得到采样数据,利用所述采样数据更新所述第一Critic网络和所述第二Critic网络的参数;步骤S604:每隔预设阈值d步更新一次所述Actor网络、所述目标Actor网络、所述第一目标Critic网络和所述第二目标Critic网络的参数;重复所述步骤S602至所述步骤S604,直到累计奖励收敛;获取训练后的所述智能体,用于对所述精馏塔的优化控制。
全文数据:
权利要求:
百度查询: 郭奕娴 化工精馏塔优化控制方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。