买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提出了一种基于回声状态网络的二次启发规划多变量控制方法,实现对溶解氧和硝态氮浓度的跟踪控制。首先,基于二次启发规划设计了在线控制框架。其次,利用梯度下降算法实现了控制框架中各网络参数的在线更新。然后,通过李雅普诺夫函数对控制器进行稳定性分析,保证了系统的渐进稳定性。最后,实验结果表明所提控制器能够精准控制溶解氧和硝态氮浓度,保证污水处理过程高效稳定运行。
主权项:1.一种基于回声状态网络的二次启发规划多变量污水处理过程控制方法,其特征在于,步骤如下:1.1污水处理过程最优控制问题分析:污水处理过程的最优控制问题表示为: 其中F·,·表示未知的函数关系,SO,5k和SNO,2k分别表示第五分区溶解氧浓度和第二分区硝态氮浓度,KLa5k表示氧传递系数,Qak表示内回流量,k为任意自然数,N为自然数的集合;因此,溶解氧浓度和硝态氮浓度xk+1的变化为以下公式:xk+1=Fxk,vk,k∈N2其中xk表示矩阵[SO,5k,SNO,2k]的变化,vk表示矩阵[KLa5k,Qak]的变化;假设1:状态xk从控制系统的第k步观察到;假设2:假设控制增益矩阵为正定,则 其中xk,vk∈R+×R+中的任意值,R+是正实数,det[·]为求矩阵的行列式运算;定义策略迭代算法中的损失函数Jk计算公式为: 其中Ui为效用函数,λ∈0,1]中的任意值;效用函数定义为: 其中x*k为xk的最优值;根据贝尔曼最优性原理和贪婪算法,最优损失函数J*k定义为:J*k=minUk+λJ*k+16其中J*k+1是下一时刻的最优损失函数,则最优控制向量v*k满足以下公式: 1.2确定泄露积分型回声状态网络:泄露积分型回声状态网络LESN具有泄漏积分性质的储备池神经元,已成功用于反馈控制系统;LESN主要有三个层次构成:输入层、储备池和输出层,其网络节点数目分别设定为K,N和M;LESN的输入向量、储备池状态向量、输出向量分别是ik、zk和yk;输入权值矩阵为Win∈WN×K中的任意值,储备池状态矩阵为W∈WN×N中的任意值,输出权值矩阵为Wout∈WN+K×M中的任意值;则LESN的储备池状态向量zk和输出向量yk更新公式分别为:zk=1-αzk-1+αfWinik+Wk-18 其中网络参数泄露率α∈0,1]中的任意值;Wk-1为前一时刻的储备池矩阵;f·表示储备池的激活函数,采用双曲正切函数,增强了网络对非线性环境的处理能力;LESN在初始化之后,仅Wout会随着学习过程的进行而发生改变;1.3DHP-LESN控制器的在线学习过程:1、利用模型LESN对非线性函数Fxk-1,vk-1进行辨识,识别当前状态,得到系统状态估计xmk,m是model的缩写,后文出现的m同理;输出表达式如下: 其中σmk=[imk,zmk],imk=[xk-1,vk-1],Wmk是模型LESN的权值,zmk是模型LESN的储备池状态向量;因此,2给出的误差emk变为:emk=xmk-xk11其中xk表示时刻k的输出状态;代价函数Emk定义为: 模型LESN输出权值的增量ΔWmk为: 其中lm是学习率;2、使用评判LESN对损失函数求导;评判LESN的表达式定义为: 其中Wck是评判LESN权值,c是critic的缩写,后文出现的c同理;对式4中的等式两边求导,得到: 根据链式推导法则,有: 根据8-9,有: 其中αm为模型LESN的泄漏率,f’m为储备池中神经元激活函数的导数,为输入矩阵中处理输入xk-1的部分,模型θmk为LESN的内部状态,其计算公式为: 其中和表示模型LESN的输入矩阵和储备池矩阵,imk和zmk表示模型LESN的输入状态和内部状态,zmk-1是模型LESN前一时刻的内部状态;因此,评判LESN的误差eck定义为: 评判LESN的目标函数Eck为: 同模型LESN的更新方法,评判LESN的输出权值ΔWck为: 其中lc是学习率;3、在DHP-LESN控制器中,执行LESN用于提供控制器的增量;输出Δvk的表达式表示为: 其中Wak是执行LESN权值,a是actor的缩写,后文出现的a同理;执行LESN的预期输出Δv*k是: 其中μ为步长;由于评判LESN的输出是结合8-9,有 其中是输入矩阵中处理输入vk的部分;由式25-式26可知,评判LESN的误差eak为: 评判LESN权值更新的目标函数Eak改写为: 同其他两个网络,执行LESN的输出权重更新ΔWak改写为: 其中la是学习率;1.4系统稳定性分析引理1:假设1-2成立;已知[xk-1,vk-1]为模型LESN的输入,结合在线梯度下降算法,定义李雅普诺夫函数L1k如下所示: 其一阶差分函数ΔL1k为: 其中,且γ1∈0,∞]中的任意值,σmk代表模型LESN的内部状态向量;引理2:假设1-2成立;评判LESN的输入为xk,因此,对于李雅普诺夫函数L2k: 的一阶差分函数ΔL2k为: 其中且γ2∈0,∞]中的任意值;引理3:假设1-2成立;执行LESN的输入为xk,因此,对于对于李雅普诺夫函数L3k: 的一阶差分函数ΔL3k为: 其中且γ3∈0,∞]中的任意值;1.5参数设定如下:1、常数γ1=1、γ2=1、γ3=1;常数λ=0.9,步长μ=0.2;网络参数泄露率α=0.9,泄漏率αm=0.9;2、执行LESN:学习率la=0.05,输入层节点数:K=2,输出层节点数:M=2,储备池节点数:N=40;3、评判LESN:学习率lm=0.01,输入层节点数:K=2,输出层节点数:M=1,储备池节点数:N=40;4、模型LESN:学习率lc=0.01,输入层节点数:K=4,输出层节点数:M=2,储备池节点数:N=30。
全文数据:
权利要求:
百度查询: 北京工业大学 一种基于回声状态网络的二次启发规划多变量污水处理过程控制方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。