买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于宽度学习的高效提取数据特征信息的水质指标BOD5监测方法。该方法在循环网络结构的启发下,将宽度学习系统的特征窗口进行递归级联以提取过程数据的时间相关性特征。在此基础上,增加了非高斯特征提取窗口,利用过完备独立成分分析方法提取污水数据所具有的非高斯性特征,丰富模型对数据不同特征的提取能力,提高模型的准确性。本发明包括“离线训练”和“在线监测”两个阶段。“此外,针对污水处理过程恶劣环境和运行工况下模型精度不足的情况,本发明所提出的模型可以通过增量的方式重构,无需从头开始对整个网络重新训练,可以在很短时间内完成网络的训练,从而能够及时的实现对于污水水质指标的快速监测。
主权项:1.一种基于宽度学习的高效提取数据特征信息的水质指标BOD5监测方法,其特征包括“离线训练”和“在线监测”两个阶段,其特征在于具体步骤如下:离线建模:分别采集三批正常工况和三批故障工况下的操作数据,每批次采样数据包含13个过程变量1344个时刻的样本数,记为X∈Rn*d,其中d和n分别代表表1中的13个过程变量和样本个数1344;BOD5,以出水五日生化需氧量BOD5为测试对象;Y∈Rn×1,代表污水处理过程中的水质指标五日生化需氧量,得到训练数据后进行数据预处理准备;表1输入模型的过程变量 步骤1:采用时间窗口对原始数据X进行扫描,得到序列化后的数据集Xp=[X1,X2,…,Xt],t=1,…,p;Xt∈Rn-p+1×d是每个特征窗口的输入数据,p是时间步长也是特征窗口的个数,n-p+1是时间窗口的步长;该模型的参数依据于知识和实际的训练效果确定,p设置为10;步骤2:将经过步骤1中时间窗口扫描处理后的数据Xp=[Xt]输入到基于循环结构的特征窗口中,所生成第t个窗口的构造公式如下:Zt=σXtWZ+Zt-1U+b01其中,第t个特征窗口Zt不仅从当前输入的Xt提取浅层特征,还通过学习第t-1个特征窗口Zt-1来提取不同时间步下数据的时间相关性特征,以形成具有循环结构的特征窗口;σ是非线性激活函数sigmoid,初始状态Z0设置为0;每个特征窗口在进行递归级联时关联到的权重与偏差都是共享的,即随机生成的符合均匀分布的权重WZ、权重U和偏置b0;步骤3:重复步骤2完成全部提取数据时间相关性的特征窗口的生成,将这些窗口进行连结表示为ZP=[Z1,Z2,…,Zp],p=10代表网络中所包含的循环特征窗口的总个数;随后,为了增强模型对数据不同过程特性的学习,创建了基于OICA的非高斯特征提取窗口;该窗口应用的OICA算法的核心思想是将训练数据X的d维过程变量通过混合矩阵D∈Rd×k分解为k个具有高阶特征的独立元kd以提取其中的非高斯信息;XT=Dα2其中,XT∈Rd×n为X的转置矩阵,α=[α1,…,αk]是独立元矩阵,k是d维过程变量分解后的独立元维度,代表第i个独立元,n是样本数量;在本发明中,取k=40;步骤4:对混合矩阵D进行求解主要分为两个步骤;首先是通过X构造由原子张成的近似子空间W=Span{N1,N2,…,Ns},Span是数学符号表示由矩阵所张成的空间;随后,近似计算中的原子最后,对原子矩阵进行特征值分解,其中最大特征值所对应的特征向量即为混合矩阵D中向量的近似解,按照编号i=1,…k顺序进行组合即可得到混合矩阵D;下面将给出求解D矩阵的全部步骤;步骤5:首先,对于估计子空间W,需要通过计算累积量生成函数CGF的海森矩阵构造ssd个矩阵N1,N2,…,Ns∈Rd×d,s=k=40,累积量生成函数的定义如下: 其中,E·表示数学期望,t∈Rd;将即零向量代入二阶的累积量生成函数,对其进行海森评估获得XT的协方差阵covXT,公式如下: 当t为非零向量时,对累积量生成函数进行海森评估获得XT的广义协方差矩阵 为了在独立元分析的背景下表示XT的广义协方差矩阵,令y=DTt,将XT=Dα带入到公式5和6中,得到: 其中,α=[α1,...,αk],αi代表第i个独立元,Cαy代表独立元的广义协方差矩阵,独立元的广义协方差矩阵表示为: 由于独立元之间的独立性,独立元的广义协方差矩阵Cαy是一个对角阵;因此,被改写为: 其中ωit=[CαDTt]ii代表αi的协方差,由公式11知原子由XT的广义协方差矩阵表示;通过足够多sd的向量t1,t2,…,ts∈Rd,得到等量的矩阵所获得数量足够多的s个Nj矩阵张成的空间即为子空间W的近似;W∈Span{N1,N2,…,Ns}12上述分析通过s个Nj矩阵近似得到了子空间W,下一步则是对子空间W中所包含的原子通过半正定优化收缩方法近似求解;下面步骤以求解半正定问题作为一个原子的解为例: 其中,argmax表示在所有属于集合子空间W的矩阵中,根据决定收缩方向的矩阵G∈Rd×d找到一个值最大的矩阵B,求解约束公式如下:K={B∈W:TrB=1,B≥0}14TrB=1表示待求矩阵B的迹等于1,B≥0表示待求的矩阵B是半正定矩阵;以上为计算单个原子的步骤;为了获得全部的原子,首先利用聚类方法选取类方差较小的聚类中心作为所选原子,随后将最优原子从W子空间中剔除利用自适应收缩继续求解;迭代k次即可获得全部的原子最后,对矩阵进行特征值分解,选取最大特征值所对应的特征向量即为混合矩阵D中的混合成分,并按照编号顺序进行组合即可得到混合矩阵D;取混合矩阵D后,数据的非高斯特征提取如下所示:G=XD15其中,G∈Rn×k代表了基于OICA的特征窗口所提取到的数据非高斯的信息;步骤6:在创建完提取数据时间相关性和非高斯性的特征窗口,为了保证该方法提取到输入数据的原始非线性特征,因此不同于经典BLS通过特征窗口映射增强窗口,该方法将原始数据X输入到增强窗口进行非线性特征的提取,具体如下:Hj=ξXWhj+βhjj=1,2,…,J16其中,ξ是非线性激活函数tanh,Whj和βhj是由均匀分布随机生成的权重和偏置;重复步骤6完成全部提取数据非线性的增强窗口的生成,将这些窗口进行连结表示为HJ=[H1,H2,…,HJ],j=1...J,Hj代表其中所包含的一个增强窗口,在本发明中增强窗口的总个数J选取为5,共有增强节点50个;最后,将所有提取不同数据特征的窗口合并为输入层:AJ=[Z1,Z2,…,Zp|G|H1,H2,…,HJ]17得到输入层后,构建多重特征增强提取的宽度学习系统,用如下公式表示:Y=AJWJ18其中,WJ=[WZ|WG|WH]是网络的输出连接权重,WZ、WG和WH分别代表污水数据的时间相关性特征、非高斯性特征和非线性特征信息的输出权重;连接权值WJ=[AJ]+Y,[·]+表示求某矩阵的伪逆,具体的计算过程如下: 其中,λ2为L2正则化参数,在本发明中取2-30,I为单位矩阵,求得宽度学习系统的输出网络权重WJ,从而获得水质指标BOD5结果;在线监测:步骤7:进行在线测量时,采集当前时刻的样本数据xnew并进行数据预处理Xnew,参考步骤1对新采集数据利用时间窗口进行序列化为其中时间步长与离线训练的模型保持一致;步骤8:将经过序列化的数据输入到训练好的多重特征增强提取的宽度学习系统中生成具有循环结构的特征窗口,提取测试数据的时间相关性特征;与此同时利用经过数据预处理后的原始数据Xnew和其转置输入进多重特征增强提取的宽度学习系统中生成非高斯特征窗口和增强窗口,提取测试数据的非高斯和非线性信息;随后,参考离线模型的参数计算出模型的最终输出为水质指标的测量结果。
全文数据:
权利要求:
百度查询: 北京工业大学 一种基于宽度学习的高效提取数据特征信息的水质指标BOD5监测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。