首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于TCNSO-MSL-TD3算法的水泥煅烧系统运行指标决策方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:燕山大学

摘要:本发明公开了一种基于TCNSO‑MSL‑TD3算法的水泥煅烧系统运行指标决策方法,属于水泥煅烧系统运行指标优化决策技术领域,包括以下步骤:步骤S1:变量选取、数据预处理及建立预测模型;步骤S2:设计基于工艺变量的状态、动作空间,并将时间维度引入状态空间构成高维状态空间;步骤S3:设计基于优化目标的奖励函数;步骤S4:搭建TCNSO‑MSL‑TD3网络;步骤S5:最优策略学习;步骤S6:长时间持续决策测试。本发明能够针对具有多耦合、时滞特性的水泥熟料煅烧系统,以数据驱动的方法建立水泥煅烧系统生产指标的预测模型作为与负责提供决策策略的智能体交互的环境。

主权项:1.一种基于TCNSO-MSL-TD3算法的水泥煅烧系统运行指标决策方法,其特征在于:包括以下步骤:步骤S1:变量选取、数据预处理及建立预测模型:利用数据驱动的方法建立水泥煅烧系统生产指标的预测模型,作为智能体与环境进行交互的代理模型;步骤S2:设计基于工艺变量的状态、动作空间,并将时间维度引入状态空间构成高维状态空间;步骤S3:设计基于优化目标的奖励函数:以代理模型的预测值和相关运行指标的实际运行情况为基础构建奖励函数;步骤S4:搭建TCNSO-MSL-TD3网络:TCNSO-MSL-TD3决策网络包括以TCN为核心的特征提取网络层和以TD3算法为核心的AC框架基本网络结构,AC框架包括策略Actor网络和评价Critic网络,Actor网络和Critic网络与相应的目标网络组成“执行网络-目标网络”形式的网络组,网络组以智能体的形式与步骤S1中训练好的代理环境进行交互学习,并基于步骤S2中的高维状态空间在AC网络的基础上增加由TCN组成的特征提取网络;步骤S5:最优策略学习:以TCNSO-MSL-TD3网络为主要组成部分的智能体通过观测环境状态输出决策动作,并根据环境反馈的奖励信息和环境变化进行策略学习,然后进行下一次滑动观测以此循环训练;步骤S6:长时间持续决策测试:在不同时间长度上对步骤S5中训练完毕的最优策略进行评价,在可视化奖励的基础上对生产指标的结构进行分析,验证TCNSO-MSL-TD3决策框架的持续决策能力。

全文数据:

权利要求:

百度查询: 燕山大学 基于TCNSO-MSL-TD3算法的水泥煅烧系统运行指标决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。