首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于LightGBM和XGBoost组合模型的飞灰含碳量软测量方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:武汉纺织大学

摘要:本发明公开了一种基于LightGBM和XGBoost组合模型的飞灰含碳量软测量方法,包括:1清除DCS数据中明显错误值与使用数据挖掘技术提取稳态数据;2在飞灰含碳量软测量中,利用特征工程中的相关矩阵与包装法解决冗余特征问题;3将处理好的数据集结合LightGBM、XGBoost和贝叶斯优化BO算法进行飞灰含碳量预测建模,选出最优超参数,提高预测精度。4使用序列最小二乘规划算法组合BO‑XGBoost和BO‑LightGBM模型。相比于一般的飞灰含碳量软测量模型,本发明提出了更细致和合理的特征处理方法,剔除了冗余特征,更有利于后续预测建模。采用序列二乘规划算法组合LightGBM、XGBoost模型,使得模型泛化能力更强,预测精度更高,同时在飞灰含碳量软测量任务中所取得的效果相比于传统的方法更好。

主权项:1.基于LightGBM和XGBoost组合模型的飞灰含碳量软测量方法,其特征在于,包括如下步骤:步骤1,获取锅炉的DCS系统数据,对获取到的DCS系统数据进行数据挖掘,具体包括明显异常值去除与数据重采样;步骤2,获取一定时期内包含相对工况测点和基准工况测点的锅炉工况测点实测参数值的历史数据变量,针对锅炉燃烧过程多变量、非线性、强耦合的特点,首先通过相关矩阵找出与飞灰含碳量耦合性强的变量,剔除其中与飞灰含碳量相关性低的变量,并通过包装法进一步提取重要变量作为后续模型的输入;步骤3,将步骤2中最终提取的重要变量分为训练集、验证集和测试集,分别采用XGBoost和LightGBM模型作为预测模型;对于给定的训练集,LightGBM模型的预测值可以由公式2表示: 其中,表示LightGBM模型的预测值,K代表决策树的数目,fk表示第k个决策树的预测值,xi表示第i个输入样本;F代表所有决策树的集合;LightGBM的目标函数Lt由式3表示: 式3中,是损失函数,表示目标值yi和预测值之间的差异,对于回归问题用均方差损失函数来表示即,损失函数为是第t次迭代中先前t-1轮的预测值,ftxi是第t轮的预测值,Ωft是模型复杂度,用公式4表示; 式4中,r和λ是正则项系数,防止决策树过于复杂,T表示目标函数中的叶子节点个数,w为叶子节点的权重系数;对于给定的训练集,XGBoost模型的预测值可以由如下公式表示: 其中,fxi表示XGBoost模型的预测值,K代表决策树的数目,fk表示第k个决策树的预测值,xi表示第i个输入样本;F代表所有决策树的集合;XGBoost模型的目标函数如式5所示; 其中,gi表示样本xi关于损失函数的一阶导数值,hi表示样本xi关于损失函数的二阶导数值,损失函数为均方差损失函数,ftxi是第t轮的预测值,λ是正则项系数,T表示目标函数中的叶子节点个数,wj表示第j个叶子节点的权重系数;步骤4,运用贝叶斯优化算法进行超参数调优,在预测模型满意度评估中,设置5折交叉验证,评估方式为RMSE,迭代次数设置为N,选出最优超参数后建立BO-LightGBM、BO-XGBoost模型进行飞灰含碳量预测;步骤5,使用序列最小二乘规划算法组合BO-XGBoost和BO-LightGBM模型的飞灰含碳量预测,获得最终的预测值;步骤5中使用序列最小二乘规划算法组合BO-XGBoost和BO-LightGBM模型时, 其中目标函数Obj是均方误差函数Y是所有样本对应的真实值的平均值;权重的初始值选取两个模型的预测值与真实值的均方误差的比值,如式7所示; 其中n是样本数据的总数,i表示第i个样本数据,w1,w2是BO-XGBoost模型和BO-LightGBM模型的权重系数,y1i是第i个样本数据通过BO-XGBoost模型得到的预测值,y2i是第i个样本数据通过BO-LightGBM模型得到的预测值,yi是第i个样本数据对应的真实值,组合模型的预测值如式8所示; 其中,和是BO-XGBoost模型和BO-LightGBM模型的所有样本对应的预测值的平均值。

全文数据:

权利要求:

百度查询: 武汉纺织大学 基于LightGBM和XGBoost组合模型的飞灰含碳量软测量方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。